AI资讯新闻榜单内容搜索-大模型

国产医疗大模型登顶权威榜单！核心秘籍：PB级训练数据、模拟医生真实会诊过程

2月7日，中文医疗大模型评测平台MedBench公布最新多模态大模型评测榜单，数坤科技的数坤坤多模态医学大模型V3以63.6分拿下第一。在榜单中，V3的表现超过微医、云知声旗下医疗行业大模型，以及OpenAI、谷歌、阿里千问旗下通用大模型。

来自主题: AI资讯

6628 点击 2026-02-14 10:38

能聊健康≠懂医疗：医疗AI助手爆火一年，“专业断层”比想象中大

基于真实居民健康档案构建的MedLLM-EHR-EVAL-V2评测集显示，星火医疗大模型在智能健康分析、报告解读、运动饮食建议、辅助诊疗、智能用药审核等关键任务上，得分均显著超越国内外主流大模型。

来自主题: AI资讯

8398 点击 2026-02-14 10:24

字节芯片，隐秘布局 | 智能涌现独家

随着豆包大模型和seedance视频生成模型等业务的爆发，自研芯片成功后，字节有望大大降低其算力成本。

来自主题: AI资讯

7190 点击 2026-02-13 12:12

具身智能的「GPT时刻」？高德连发两个全面SOTA的ABot具身基座模型

过去几年，大模型把自然语言处理彻底重塑了。GPT 出来之前，NLP 领域的状态是：每个任务一套模型，每个场景一批数据，每个公司一条流水线，互不通用，边界清晰。GPT 之后，这套逻辑被一个预训练底座 + 任务微调的范式整个替换掉了。

来自主题: AI技术研报

5422 点击 2026-02-13 12:02

小米的首代机器人VLA大模型来了！丝滑赛德芙，推理延迟仅80ms丨全面开源

就是说，这几天还有哪档晚会节目是没有机器人现身的吗？

来自主题: AI技术研报

9167 点击 2026-02-13 12:01

国产大模型杀疯了，MiniMax-M2.5即将开源！

这两天 AI 圈真的太热闹了，就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时，MiniMax 率先冲锋，更新了他们的新旗舰模型：MiniMax-M2.5。更有意思的是，国外网友这段时间对国内 AI 大模型的更新节奏格外关注，他们甚至把这种争先更新的现象称为：Happy Chinese new year！

来自主题: AI资讯

9655 点击 2026-02-12 18:07

蚂蚁全模态模型开源！首创人声配乐音效一次生成，图像编辑指哪改哪

这个国产开源模型，把多模态玩出了“魔法”感。

来自主题: AI技术研报

8088 点击 2026-02-12 15:38

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

5463 点击 2026-02-12 15:32

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

6940 点击 2026-02-12 14:56

千星项目LLMRouter：多模型路由，16+策略优化推理

UIUC开源的智能模型路由框架LLMRouter可以自动为大模型应用选择最优模型，提供16+路由策略，覆盖单轮选择、多轮协作、个性化偏好和Agent式流程，在性能、成本与延迟间灵活权衡。

来自主题: AI技术研报

8856 点击 2026-02-12 14:55