
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”有史规模最大的开源科学推理后训练数据集来了! 上海创智学院、上海交通大学(GAIR Lab)发布MegaScience。该数据集包含约125万条问答对及其参考答案,广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域,旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。
有史规模最大的开源科学推理后训练数据集来了! 上海创智学院、上海交通大学(GAIR Lab)发布MegaScience。该数据集包含约125万条问答对及其参考答案,广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域,旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。
AutoGame 创始人张昊阳从腾讯制作人转型为 AI 沙盒游戏创业者,其团队打造的 AI 游戏《麦琪的花园》以零推广在 Steam 首发登上新品榜 Top50,并在一个月内积累超过 5000 愿望单。它让普通人也能“一句话生成 NPC、任务与副本”,通过 AI 驱动的 UGC 系统,让内容创作从金字塔走向“十字型”,成为 Z 世代表达与社交的新方式。
据知情人士透露,Meta Platforms 已收购专注于人工智能情感识别与音频模拟的小型初创公司 WaveForms AI。
知情人士表示,风险投资公司Accel 正主导德国人工智能初创企业 n8n 的新一轮融资,这将使该公司估值呈指数级增长至 23 亿美元。
北京大学提出了ReMoMask:一种全新的基于检索增强生成的Text-to-Motion框架。它是一个集成三项关键创新的统一框架:(1)基于动量的双向文本-动作模型,通过动量队列将负样本的尺度与批次大小解耦,显著提高了跨模态检索精度;(2)语义时空注意力机制,在部件级融合过程中强制执行生物力学约束,消除异步伪影;(3)RAG-无分类器引导结合轻微的无条件生成以增强泛化能力。
互联网技术的发展极大地便利了我们的生活,但许多网络任务重复繁琐,降低了效率。为了解决这一问题,研究人员正在开发基于大型基础模型(LFMs)的智能体——WebAgents,通过感知环境、规划推理和执行交互来完成用户指令,显著提升便利性。香港理工大学的研究人员从架构、训练和可信性等角度,总结了WebAgents的代表性方法,全面梳理了相关研究进展。
随着 Gemini-Diffusion,Seed-Diffusion 等扩散大语言模型(DLLM)的发布,这一领域成为了工业界和学术界的热门方向。但是,当前 DLLM 存在着在推理时必须采用预设固定长度的限制,对于不同任务都需要专门调整才能达到最优效果。
当大模型把人类曾经的终极考题变成日常练习,AI的奔跑却悄悄瘸了腿—— 训练能力突飞猛进,验证答案的本事却成了拖后腿的短板。 为此,上海AI Lab和澳门大学联合发布通用答案验证模型CompassVerifier与评测集VerifierBench。填补了Verifier领域没有建立验证->提升->验证的循环迭代体系的空白。
不管我们如何评价ChatGPT,这个产品在人工智能历史上的地位,肯定是无法撼动的,就跟iPhone在智能手机发展史上的地位一样。但是从另一个角度来看,现在的智能手机,无论是苹果还是安卓,每个版本之间,也已经几乎没有跨越台阶式的进步了。
AI对话技术最初用于年轻人整蛊父母的声音克隆,但老年人主动用作“情感拐杖”缓解孤独,带来安全倾诉环境。心理咨询师警告AI可能导致即时反馈成瘾、替代真实关系,削弱现实冲突应对力,类似《her》电影困境;AI谄媚性模糊是非,影响判断力。技术初衷高效连接需求,却简化人际复杂本质。