AI资讯新闻榜单内容搜索-模型训练

让LLM像公司一样干活：微软把“思维并发”做成了协议，准确率更高、关键路径时延降28%

我们长期把LLM当成能独闯难关的“单兵”，在很多任务上，这确实有效。

来自主题: AI技术研报

9340 点击 2025-11-13 09:09

华中科技大学团队推出首个水下多模态大模型NAUTILUS，支持8种水下场景理解任务，并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题，性能超越现有模型，恶劣环境下表现更佳。

来自主题: AI技术研报

11167 点击 2025-11-12 17:16

复杂的简历，AI也能读懂了。

来自主题: AI技术研报

10187 点击 2025-11-12 17:15

在数字经济浪潮中，企业对于高效、精准的信息获取与决策支持的需求日益迫切。从前沿科学探索到行业趋势分析，再到企业级决策支持，一个能够从海量异构数据源中提取关键知识、执行多步骤推理并生成结构化或多模态输出的「深度研究系统」正变得不可或缺。

来自主题: AI技术研报

8050 点击 2025-11-12 17:05

“我最近喉咙像刀割一样痛，还伴随鼻塞，但没有咳嗽……这是染上流感，还是又中招了？”

来自主题: AI资讯

9587 点击 2025-11-12 16:22

3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法，给定 3D 场景的一组带位姿的图像（即带有位置和方向的图像），3DGS 会迭代训练一个场景表示，该表示由大量各向异性 3D 高斯体组成，用以捕捉场景的外观和几何形状。

来自主题: AI技术研报

11433 点击 2025-11-12 10:51

你是否曾为搭建具身仿真环境耗费数周学习却效果寥寥？是否因人工采集海量交互数据需要高昂成本而望而却步？又是否因找不到足够丰富真实的开放场景让你的智能体难以施展拳脚？

来自主题: AI技术研报

10998 点击 2025-11-12 09:32

复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni，统⼀视觉、⽂本、听觉与动作模态，实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情境指令」真机操作数据，引领机器⼈从「被动执⾏⼈类指令」迈向「主动提供服务」新时代。

来自主题: AI技术研报

9601 点击 2025-11-12 09:29

在一场矿难救援中，时间意味着生命。想象一台搜救机器人在部分坍塌的矿井中穿行：浓烟、碎石、扭曲的金属梁。它必须在险象环生的环境中迅速绘制地图，识别路径，并精准定位自己的位置。

来自主题: AI技术研报

8768 点击 2025-11-12 08:51

全开源多模态大模型（MLLM）的性能，长期被闭源和半开源模型“卡脖子”。

来自主题: AI技术研报

8209 点击 2025-11-11 16:39