深度思维正式推出“数学做题家AI”
《自然》杂志11月12日发表了一项重要成果:英国深度思维正式推出其开发的“数学做题家AI”AlphaProof,其成功证明了复杂的数学定理,并在2024年国际数学奥林匹克竞赛(IMO)中取得了相当于银牌的优异成绩。这项研究展示了AI在高难度数学推理领域的显著进步。
深度思维2004年曾透露其混合AI系统在同年的IMO竞赛中表现优异,仅差1分就能摘得金牌。而今正式发布论文推出并详解该AI系统。
目前,许多大型语言模型虽然具备强大的生成能力,却难以验证其推理是否正确,因为它们通常基于非正式的自然语言进行训练和输出,缺乏严格的逻辑结构。为应对这一挑战,深度思维团队将强化学习引入一个名为Lean的正式数学证明环境,在该系统中,所有推理步骤都必须符合形式化逻辑规则,从而能够被自动验证。
AlphaProof是专为证明数学命题而设计的系统。团队首先对约8000万个数学命题进行了自动形式化处理,随后利用强化学习让AlphaProof在这些命题中探索有效的证明路径。结果显示,该系统不仅超越了此前最先进的AI模型在历史IMO题目上的表现,还在今年的竞赛中联合另一款专攻几何的AI系统AlphaGeometry,共同解决了6道题中的4道,达到银牌水平。
科普中国APP
科学素质竞赛
幸福肥东微信
合肥科普微信
肥东科协