全球最顶尖的数学奥赛题库来了!近日,麻省理工学院推出MathNet数据库,数据库首次汇集了3万多道来自全球的顶尖奥数题,并且向公众免费开放。所有人都可以去挑战一下自己的数学水平,要知道哪怕是最顶尖的人工智能大模型,平均准确率也仅仅不到七成。

据了解,此前还没有一个平台能够汇集全球各国的奥数题,所以,麻省理工的团队希望能够将这些人类智慧的结晶进行收集和汇总。这一数据库共汇集了来自47个国家、143项赛事、17种语言的3万多道数据题。在收集过程中,团队对每一道题目进行了严格的核实和审校,确保其权威性。

其后麻省理工的团队还让各路AI大模型去进行解题,结果发现,最顶尖的大模型也没法做到轻松征服这些人类智慧的结晶,面对包含6400道题的主力测试集,目前最高的准确率也只有78.4%。  

而在“同类问题检索”任务中,AI们的第一次尝试的准确率不到5%。这项任务要求模型给出答案的同时,还要在题库中找出结构相似或逻辑等价的题目。AI的得分之低说明它们在理解数学逻辑的本质上,还无法和人类相提并论。

文、视频|记者 李钢

责编: 校对: 审签:
版权申明

羊城晚报·羊城派原创,未经授权不得转载