AI资讯新闻榜单内容搜索-上海AI

大模型也需要自我反思，上海AI Lab合成“错题本”让大模型数学成绩提升13.3%

大模型学习不仅要正确知识，还需要一个“错题本”？

来自主题: AI技术研报

8588 点击 2025-06-18 15:19

大幅缓解LLM偏科，只需调整SFT训练集的组成。

来自主题: AI技术研报

7984 点击 2025-06-11 12:01

逻辑推理是人类智能的核心能力，也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现，研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)

来自主题: AI技术研报

9785 点击 2025-06-07 10:35

AI Agent又解锁了一个领域！清华大学牵头，与西北工业大学以及上海AI lab等机构推出了电镜领域的AI agent——AutoMat。

来自主题: AI技术研报

8566 点击 2025-06-06 15:14

GPT-4o-Image也只能完成28.9%的任务，图像编辑评测新基准来了！360个全部由人类专家仔细思考并校对的高质量测试案例，暴露多模态模型在结合推理能力进行图像编辑时的短板。

来自主题: AI技术研报

10984 点击 2025-05-31 14:37

大语言模型遇上加密数据，即使是最新Qwen3也直冒冷汗！

来自主题: AI技术研报

8849 点击 2025-05-29 14:59

围棋因其独特的复杂性和对人类智能的深刻体现，可作为衡量AI专业能力最具代表性的任务之一。

来自主题: AI技术研报

10276 点击 2025-05-25 16:03

OpenAI 研究员姚顺雨近期发布文章，指出：AI 下半场将聚焦问题定义与评估体系重构。在 AI 发展新阶段，行业需要通过设计更有效的模型评测体系，弥补 AI 能力与真实需求的差距。

来自主题: AI技术研报

11385 点击 2025-05-24 15:33

长文本能力对语言模型（LM，Language Model）尤为重要，试想，如果 LM 可以处理无限长度的输入文本，我们可以预先把所有参考资料都喂给 LM，或许 LM 在应对人类的提问时就会变得无所不能。

来自主题: AI技术研报

9811 点击 2025-05-09 10:42

4月29日，习近平总书记在上海考察时，在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下，来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。

来自主题: AI资讯

8822 点击 2025-05-01 14:22