新智元独家报道
编辑:桃子
【新智元深度解析】
在人工智能的又一里程碑时刻,o3-mini成功攻克了图论领域的专家级难题,并获得了知名数学家陶哲轩的高度评价。经过实际测试,陶哲轩指出,大型语言模型(LLM)并非数学研究的万能钥匙,其效用取决于问题的性质和AI的调教方法。
o3-mini的突破性进展:图论难题一秒解决
令人惊叹的是,o3-mini已进化至能够迅速解决图论难题。近日,陶哲轩在社交平台上分享了自己利用AI辅助数学证明的案例和心得。
以Ruzsa-Szemeredi的“三角移除引理”为例
陶哲轩以Ruzsa-Szemeredi的“三角移除引理”为例,旨在证明图论中的一个标准结论:一个由n个顶点和n个诱导匹配构成的图,其边数仅为o(n^2)。
三种证明方法:手动推导、网络搜索、借助大模型
要证明这个定理,有三种途径:手动推导、网络搜索或借助大型语言模型。陶哲轩选择了第三种方式,让o3-mini来完成证明。
AI的出色表现:几秒内给出精准答案
结果令人眼前一亮,AI在几秒钟内就提供了一个正确答案,并清晰地展示了“三角移除引理”如何限制边数。
o3-mini的证明思路:编码与三角形移除引理
陶哲轩询问o3-mini如何从Ruzsa-Szemerédi三角形移除引理推导出上述结论。o3-mini的答案是,通过在辅助图中将诱导匹配的边“编码”为三角形,并应用三角形移除引理。
LLM在数学研究中的应用:快速提供论证细节
陶哲轩表示,AI能够满足他的即时需求,这表明LLM在快速提供某一领域内标准论证的细节方面,是一个出色的工具。用户可以随后验证其正确性。
LLM的局限性:研究级别问题表现不佳
然而,当问题转向研究级别或较少被讨论的领域时,LLM的表现就明显下降了。以Ruzsa-Szemeredi (6,3)定理为例,模型在初始回答中缺乏关键细节,需要多次提示和引导才能给出一个基本正确的推导证明。
陶哲轩的观察:LLM的能力与局限性
陶哲轩通过这次亲测,对LLM在数学研究中的能力进行了观察。他表示,对于教科书级别的标准问题,模型的表现几乎完美,几乎无需干预。但对于研究级别的问题,模型的成功率显著下降。
AI辅助数学研究:前景与挑战
在评论区,网友们对AI辅助数学研究的前景和挑战进行了热烈的讨论。有人质疑AI工具的意义,认为即使网络搜索质量有所下降,它仍然能提供准确的结果。陶哲轩则认为,AI工具的意义在于获取新事物的灵感。
独立验证信息的重要性
陶哲轩强调,无论是否有AI,独立验证信息的能力正变得愈发重要。在纯数学领域,他提出了一种潜在的解决方案,即要求生成式AI通过形式化证明助手来验证其输出,以确保正确性。
结语:LLM与人类创作的数学
陶哲轩认为,理想情况下,人类创作的数学也应当越来越多地采用形式验证;但他预计AI生成或AI辅助的数学研究会提前实现这一点。
参考资料: