AI资讯新闻榜单内容搜索-EVI

AI医生终于有了硬标尺！全球首个专病循证评测框架GAPS发布，蚂蚁联合北大王俊院士团队出品

蚂蚁健康与北京大学人民医院王俊院士团队历时6个多月，联合十余位胸外科医生共同打磨，发布了全球首个大模型专病循证能力的评测框架—— GAPS（Grounding, Adequacy, Perturbation, Safety），及其配套评测集 GAPS-NSCLC-preview。

来自主题: AI技术研报

11146 点击 2025-12-29 15:06

顶刊TPAMI｜多模态视频理解领域重磅数据更新：MeViSv2发布

近日，多模态视频理解领域迎来重磅更新！由复旦大学、上海财经大学、南洋理工大学联合打造的 MeViSv2 数据集正式发布，并已被顶刊 IEEE TPAMI 录用。

来自主题: AI技术研报

10455 点击 2025-12-29 09:07

美国模型长期霸榜的LMArena，出现了一个国产模型

时间过得太快了，一转眼就来到了 2025 年的年底。我们距离 2026 年只剩下了 8 天。回看 AI 模型和产品突飞猛进这一年，中美两家 AI 阵营的行业发展路径有了挺大的区分，大家的关注度不再是单一模型、单一能力，而是“模型+工程+场景”的复合能力。这个变化在年底愈发明显。

来自主题: AI资讯

10407 点击 2025-12-25 14:17

估值暴涨1200%！今年最火AI医疗诞生，年收入超10亿，国内这些公司在追赶！

AI医疗，出现了超级独角兽！据报道，AI医疗企业OpenEvidence正在进行新一轮2.5亿美元融资，估值已经达到惊人的120亿美元！这已经是OpenEvidence一年内的4次融资，投资人对这家公司的追捧程度可见一斑。

来自主题: AI资讯

8906 点击 2025-12-16 10:43

Nano Banana Review：摄影棚里的宇航员——美国登月造假调查

谁能想到，阿姆斯特朗那句“人类的一大步”，其实是在内华达州戈壁的一个人造布景中原地踏步。本报道中的所有照片均为2025年11月21日首次披露——内华达州，托诺帕——当74岁的埃利亚斯·索恩（Elias Thorne）终于决定开口时，他并没有选择忏悔，而是点燃了一支受潮的万宝路。

来自主题: AI资讯

10089 点击 2025-12-10 00:08

影响有多大？ICLR开盒大瓜后，OpenReview公布真相

机器之心报道编辑：+0、陈陈最近，学术圈的大瓜莫过于 ICLR 评审大开盒事件了，只要在浏览器上输入某个网址，自行替换你要看的 paper ID 和审稿人编号，你就可以找到对应的审稿人身份。你甚至

来自主题: AI资讯

10543 点击 2025-12-01 13:46

速递｜AI编程工具收入突破31亿美元，Cursor、Claude Code与Devin成三大引擎

由Anysphere 的 Cursor 和 Anthropic 的 Claude Code 等 AI 编程工具共同创造的收入已突破 31 亿美元。据直接了解 Cognition 财务状况的人士透露，这其中包括 Cognition 的 Devin 编程代理产生的近 4 亿美元年化收入——这一数字此前未被报道过。

来自主题: AI资讯

9461 点击 2025-11-27 14:37

学生3年投稿6次被拒，于是吴恩达亲手搓了个评审Agent

科研人不容易。3年投稿6次全被拒，每次等反馈要半年？？机器学习大佬吴恩达听说这位学生的“水逆”遭遇后，亲手搓了个免费的AI论文评审智能体出来。通过在ICLR 2025审稿数据上训练系统，并在测试集中对比发现，该AI审稿系统与人类审稿的相关系数达0.42，和人与人审稿间的0.41相近甚至还高一点。

来自主题: AI资讯

9323 点击 2025-11-25 17:17

Z Potentials｜专访TestSprite创始人，前AWS&Google工程师，打造全球4万开发者的测试Agent

这两年，写代码这件事变了。GitHub Copilot、Cursor、Devin 一路登场，工程师开始习惯“打一段话，几千行代码自己长出来”。写得出东西，变得前所未有地容易。但很快大家发现，真正拖住上线节奏的，不再是「能不能写出来」，而是「敢不敢放上生产环境」——代码量指数级增长，验证、回归、极端场景覆盖反而被彻底压缩，测试成了 AI 时代新的“硬瓶颈”。

来自主题: AI资讯

11138 点击 2025-11-25 17:16

2.4万亿参数原生全模态，文心5.0一手实测来了

刚刚，文心5.0正式发布了！全新一代主打原生全模态，最开始就把语言/图像/视频/音频放在同一套自回归统一架构里，做统一的理解与生成训练。所以，最终模型能够做到支持全模态输入（文字/图片/音频/视频）+全模态输出（文字/图片/音频/视频），创意写作、指令遵循、智能体规划方面也更强了。

来自主题: AI资讯

10484 点击 2025-11-13 21:01