AI资讯新闻榜单内容搜索-开源模型

o3绞尽脑汁仅答对40%的题目，开源模型基本乱猜？MMSI-Bench：多图空间智能试金石

AI能看图，也能讲故事，但能理解“物体在哪”“怎么动”吗？空间智能，正是大模型走向具身智能的关键拼图。

来自主题: AI技术研报

7870 点击 2025-06-11 15:58

用AI来整理会议内容，已经是人类的常规操作。不过，你猜怎么着？面对1000道多步骤音频推理题时，30款AI模型竟然几乎全军覆没，很多开源模型表现甚至接近瞎猜。

来自主题: AI技术研报

10420 点击 2025-06-09 14:43

能够完成多步信息检索任务，涵盖多轮推理与连续动作执行的智能体来了。通义实验室推出WebWalker（ACL2025）续作自主信息检索智能体WebDancer。

来自主题: AI技术研报

8339 点击 2025-06-06 16:31

智源研究院发布开源模型Video-XL-2，显著提升长视频理解能力。该模型在效果、处理长度与速度上全面优化，支持单卡处理万帧视频，编码2048帧仅需12秒。

来自主题: AI技术研报

8668 点击 2025-06-03 17:24

长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展，当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。

来自主题: AI技术研报

8786 点击 2025-06-03 14:44

原生1bit大模型BitNet b1.58 2B4T再升级！微软公布BitNet v2，性能几乎0损失，而占用内存和计算成本显著降低。

来自主题: AI技术研报

9766 点击 2025-06-02 18:00

今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API，对用户开放思维链输出，通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯

10363 点击 2025-05-28 21:49

基于开源模型继续在下游任务上使用私有下游数据进行微调，得到在下游任务表现更好的专有模型，已经成为了一类标准范式。

来自主题: AI技术研报

10551 点击 2025-05-28 09:55

Mistral沉默好久，果然在憋大招。

来自主题: AI资讯

8484 点击 2025-05-22 16:03

教AI学会使用工具，带图推理就能变得更强？！

来自主题: AI技术研报

8276 点击 2025-05-17 16:03