阿里巴巴全球数学竞赛再度引人注目。来自江苏涟水中等专业学校的17岁女生姜萍以全球排名第12的成绩,成为赛事史上首位进入决赛的中专生。
今年的竞赛还首次设置了人工智能(AI)大模型挑战赛,吸引了来自全球高校和企业组建的563支AI队伍与姜萍同场竞技。
最终,AI队伍的平均分达到18分,接近人类选手的平均水平。然而,最高得分仅为34分,远低于人类选手的最高分113分,且无一队进入决赛。
上海建平中学的涂津豪个人推出的AI方案获得了AI挑战赛最高分。他的方法是让多个大模型进行自问自答和自我验证,以寻求问题的最优解。
西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队分别以27分位列亚军和季军。
虽然AI在数学竞赛中展现了潜力,但专家指出,当前的大语言模型在复杂推理和严谨思考方面仍有局限。
AI在逻辑推理和证明题方面的表现欠佳,表明人类选手在深层逻辑推理和创新思维上仍保持着优势。
(举报)