
大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%
大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%大模型学习不仅要正确知识,还需要一个“错题本”?
来自主题: AI技术研报
6700 点击 2025-06-18 15:19
大模型学习不仅要正确知识,还需要一个“错题本”?
数学题, 一直是检验 AI 实力的 “硬核考场” —— 公式推导、逻辑链条、抽象思维缺一不可 。最近,我好了几天时间对国内外 7 款大厂模型展开了一场 “数学高考 ”,用阿里全球数学竞赛 + 中国奥赛真题实测它们的智商上限。
只是换一下数学题的变量名称,大模型就可能集体降智??
只要不到10行代码,就能让大模型数学能力(GSM8k)提升20%!
只要10k数据,就能让大模型的数学成绩增长5.6%。
又一项针对AI模型的数学奥赛来了!只要在50道题中做出3道,就有可能把百万美元大奖抱回家。题目难度为人类的高中学术竞赛难度,包括基础算术、代数思维和几何推理。欢迎AI模型们踊跃报名。
用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登Nature。
专门为AI设立的IMO国际奥林匹克数学竞赛来了—