563支AI队伍和姜萍答了同一份试卷:最高34分,无一入围决赛

2024-06-16 16:33 阅读
澎湃新闻综合

6月13日,第六届阿里巴巴全球数学竞赛(下称“阿里数赛”)公布决赛名单,17岁的江苏涟水中等专业学校学生姜萍排名12位,成为全球30名里唯一的女选手。

连续多日的热搜,让公众知道了这位天才少女,也让更多人知道了阿里数赛。与往届不同,今年的阿里数赛首次开放了AI大模型挑战赛,吸引了来自全球知名高校院所与企业的563支队伍报名,它们与姜萍解答了同一份试卷。

4月13日早上8点,阿里数赛开考,数万名来自全球各地的数学爱好者,需要完成其中选择题、解答题与证明题的考验。但在6月13日公布的决赛名单中,801名晋级者里没有一支AI队伍入围。

据赛事官方统计,参与竞赛的AI队伍的平均分为18分,已赶上人类选手的平均水平。但AI的最高分仅为34分,与人类选手最高分113分相比,差距甚远。

据介绍,AI成绩不佳,核心还是由于基础模型的数学能力有限。虽然在面对解答题和证明题时,AI可以通过知识检索等方式拿到基础分,但一旦涉及到后续的深入分析,AI就开始出现“知识幻觉”。尤其是在面临选择题时,多数AI出现了“蒙题”的现象。不过,也有案例显示,提示词工程确实能够在一定幅度内提升AI的数学潜能,有选手请AI扮演一名数学竞赛大师,并许诺“想出更好回答奖励30万美元”,经比对验证,该方法可提高20%的得分率。阿里数赛组委会成员、达摩院决策智能实验室负责人印卧涛表示,“数学是人类智慧的皇冠,AI挑战赛是一项积极的尝试,有助于我们持续突破AI的能力上限,带来更多可能。”

公告显示,今年共有801名人类选手挺进决赛,遍布全球17个国家与地区,平均年龄22岁,主要来自北大、清华、麻省理工、剑桥等知名高校。江苏省涟水中等专业学校的17岁女生姜萍表现亮眼,从一众名校生中突围,拿到了93分的好成绩,全球排名12,是阿里数赛举办以来首位打进决赛的中专在读生。她专业是服装设计,对数学却十分着迷,花了两年自学偏微分方程,预选赛的两天里除了吃饭、睡觉都在答题,只为证明“女生学数学也可以挺棒的”。

 

编辑:李孟玲 审核:李薇

用户点评
    已显示全部评论
    点击查看更多评论()
    分享到微信朋友圈
    x

    打开微信,点击底部的“发现”,

    使用“扫一扫”即可将网页分享至朋友圈。

    打开APP
    前往,阅读体验更佳
    取消
    ×
    问政江西小程序
    长按进入,阅读更多问政江西内容