来源:哈佛大学
为评估AI在数学研究中的真实能力,11位顶尖数学家发起“First Proof”挑战赛,公布了10个已解决但未公开的前沿问题,邀请AI尝试独立证明。初步测试显示,当前最佳AI模型仅能解答其中两题,且存在逻辑错误与虚构引用。数学家指出,AI擅长整合已知结果与算法性问题,但在提出原创问题、构建研究框架及实现概念飞跃方面,仍远未达到人类专家水平,所谓“AI替代数学家”的论调为时过早。
来源:哈佛大学
为评估AI在数学研究中的真实能力,11位顶尖数学家发起“First Proof”挑战赛,公布了10个已解决但未公开的前沿问题,邀请AI尝试独立证明。初步测试显示,当前最佳AI模型仅能解答其中两题,且存在逻辑错误与虚构引用。数学家指出,AI擅长整合已知结果与算法性问题,但在提出原创问题、构建研究框架及实现概念飞跃方面,仍远未达到人类专家水平,所谓“AI替代数学家”的论调为时过早。