《自然》17日发表的一项计算科学研究,描述了一个能解国际数学奥林匹克竞赛级别几何题的人工智能(AI)系统。其表现超过了之前最好的自动化定理证明系统。该研究证明了AI已接近人类破解复杂逻辑问题的最高水平。
奥林匹克竞赛中的数学定理证明需要高水平的逻辑推理和解题能力。然而,当前基于机器学习的AI系统在证明数学定理方面还有困难。机器学习通过向计算机提供参考数据,让计算机学习如何执行特定任务。但由于作为训练数据的人类示范很少,所以定理证明,尤其是几何学定理很难被证明。
谷歌“深度思维”团队此次描述了一种不需要人类示范的定理证明方法。基于这一方法的AI系统名为“阿尔法几何”(G0)。它综合了复杂程度各异的数百万条定理和证明,并利用一个神经语言模型完成自我训练。这种方法结合符号演绎引擎(能搜索难题中的大量分支点),能让G0在无需人类直接输入的情况下学习并解开复杂问题。
团队用国际数学奥林匹克竞赛2000年至2020年间的30个问题测试了该系统。G0解出了其中25题,接近国际数学奥林匹克竞赛金牌选手的平均表现。而之前最优秀的方法只解出了10题。值得一提的是,G0能生成人类可阅读的证明,甚至发现了2004年国际数学奥林匹克竞赛定理的一个新版本。
研究人员指出,G0目前仅限于证明几何学定理,但这种方法或许能应用于其他数学领域。
(责任编辑:毕安吉)