AI资讯新闻榜单内容搜索-通用大模型

打败GPT-5.2，嵌入真实工业生产，这个大模型什么来头？

最近，一批顶级通用大模型参加了三场特殊的“工业执业考试”。

来自主题: AI资讯

6904 点击 2026-03-10 10:03

2月7日，中文医疗大模型评测平台MedBench公布最新多模态大模型评测榜单，数坤科技的数坤坤多模态医学大模型V3以63.6分拿下第一。在榜单中，V3的表现超过微医、云知声旗下医疗行业大模型，以及OpenAI、谷歌、阿里千问旗下通用大模型。

来自主题: AI资讯

7882 点击 2026-02-14 10:38

外网都在好奇：全球模型服务平台 OpenRouter 上这个搜索第一的神秘模型是哪家的？这个匿名模型叫做「Pony Alpha」。根据 OpenRouter 官方的说法，它是新一代的通用大模型，在编程、逻辑推理和角色扮演方面表现突出，并针对 Agent 工作流进行了优化，具有极高的工具调用准确率。

来自主题: AI资讯

9153 点击 2026-02-08 10:59

岁末年初，全球AI竞争聚焦到了最新趋势—— 太空算力。

来自主题: AI资讯

10490 点击 2026-01-28 15:32

1月10日，很久没有公开露面的月之暗面创始人杨植麟，在一场定向邀请的行业论坛中，详细地分享了2025年Kimi的技术路线重点，以及对未来的思考。这次分享，有一个核心关键词，Agentic智能时代。这是通用大模型竞争的一个未来高地

来自主题: AI资讯

9646 点击 2026-01-11 09:51

本文为《2025 年度盘点与趋势洞察》系列内容之一，由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传统行业等方向，通过长期跟踪、与业内专家深度访谈等方式，对重点领域进行关键技术进展、核心事件和产业趋势的洞察盘点。

来自主题: AI资讯

9568 点击 2026-01-08 15:22

2025 年，随着李飞飞等学者将 “空间智能”（Spatial Intelligence）推向聚光灯下，这一领域迅速成为了大模型竞逐的新高地。通用大模型和各类专家模型纷纷在诸多室内空间推理基准上刷新 SOTA，似乎 AI 在训练中已经更好地读懂了三维空间。

来自主题: AI技术研报

9038 点击 2026-01-07 09:36

通用大模型（LLM）的狂飙突进，终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE（美国执业医师资格考试）中表现优异，但在面对需要「火眼金睛」和「毫厘必争」的心脏手术台上，通用大模型的表现究竟如何？

来自主题: AI技术研报

8775 点击 2025-12-16 17:23

南洋理工大学研究人员构建了EHRStruct基准，用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务，包含2200个样本，按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型，数据驱动任务表现更强，输入格式和微调方式对性能有显著影响。

来自主题: AI技术研报

10558 点击 2025-12-16 16:27

近日，清华大学深圳国际研究生院的机器人博士团队创办的「知有无界」获得卓源亚洲领投、力合科创跟投的种子轮融资。「知有无界」诞生在清华大学王学谦教授的智能机器人实验室，实现了全球首个船舶具身通用大模型，本轮融资后，「知有无界」将会进一步加快在船坞的商业化落地，并持续进行多代产品的研发。

来自主题: AI资讯

8023 点击 2025-12-03 10:25