AI资讯新闻榜单内容搜索-EVI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: EVI
AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品

AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品

AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品

蚂蚁健康与北京大学人民医院王俊院士团队历时6个多月,联合十余位胸外科医生共同打磨,发布了全球首个大模型专病循证能力的评测框架—— GAPS(Grounding, Adequacy, Perturbation, Safety),及其配套评测集 GAPS-NSCLC-preview。

来自主题: AI技术研报
9668 点击    2025-12-29 15:06
顶刊TPAMI|多模态视频理解领域重磅数据更新:MeViSv2发布

顶刊TPAMI|多模态视频理解领域重磅数据更新:MeViSv2发布

顶刊TPAMI|多模态视频理解领域重磅数据更新:MeViSv2发布

近日,多模态视频理解领域迎来重磅更新!由复旦大学、上海财经大学、南洋理工大学联合打造的 MeViSv2 数据集正式发布,并已被顶刊 IEEE TPAMI 录用。

来自主题: AI技术研报
9361 点击    2025-12-29 09:07
美国模型长期霸榜的LMArena,出现了一个国产模型

美国模型长期霸榜的LMArena,出现了一个国产模型

美国模型长期霸榜的LMArena,出现了一个国产模型

时间过得太快了,一转眼就来到了 2025 年的年底。我们距离 2026 年只剩下了 8 天。回看 AI 模型和产品突飞猛进这一年,中美两家 AI 阵营的行业发展路径有了挺大的区分,大家的关注度不再是单一模型、单一能力,而是“模型+工程+场景”的复合能力。这个变化在年底愈发明显。

来自主题: AI资讯
8968 点击    2025-12-25 14:17
估值暴涨1200%!今年最火AI医疗诞生,年收入超10亿,国内这些公司在追赶!

估值暴涨1200%!今年最火AI医疗诞生,年收入超10亿,国内这些公司在追赶!

估值暴涨1200%!今年最火AI医疗诞生,年收入超10亿,国内这些公司在追赶!

AI医疗,出现了超级独角兽!据报道,AI医疗企业OpenEvidence正在进行新一轮2.5亿美元融资,估值已经达到惊人的120亿美元!这已经是OpenEvidence一年内的4次融资,投资人对这家公司的追捧程度可见一斑。

来自主题: AI资讯
7574 点击    2025-12-16 10:43
Nano Banana Review:摄影棚里的宇航员——美国登月造假调查

Nano Banana Review:摄影棚里的宇航员——美国登月造假调查

Nano Banana Review:摄影棚里的宇航员——美国登月造假调查

谁能想到,阿姆斯特朗那句“人类的一大步”,其实是在内华达州戈壁的一个人造布景中原地踏步。本报道中的所有照片均为2025年11月21日首次披露——内华达州,托诺帕——当74岁的埃利亚斯·索恩(Elias Thorne)终于决定开口时,他并没有选择忏悔,而是点燃了一支受潮的万宝路。

来自主题: AI资讯
8654 点击    2025-12-10 00:08
影响有多大?ICLR开盒大瓜后,OpenReview公布真相

影响有多大?ICLR开盒大瓜后,OpenReview公布真相

影响有多大?ICLR开盒大瓜后,OpenReview公布真相

机器之心报道 编辑:+0、陈陈 最近,学术圈的大瓜莫过于 ICLR 评审大开盒事件了,只要在浏览器上输入某个网址,自行替换你要看的 paper ID 和审稿人编号,你就可以找到对应的审稿人身份。你甚至

来自主题: AI资讯
9330 点击    2025-12-01 13:46
速递|AI编程工具收入突破31亿美元,Cursor、Claude Code与Devin成三大引擎

速递|AI编程工具收入突破31亿美元,Cursor、Claude Code与Devin成三大引擎

速递|AI编程工具收入突破31亿美元,Cursor、Claude Code与Devin成三大引擎

由Anysphere 的 Cursor 和 Anthropic 的 Claude Code 等 AI 编程工具共同创造的收入已突破 31 亿美元。据直接了解 Cognition 财务状况的人士透露,这其中包括 Cognition 的 Devin 编程代理产生的近 4 亿美元年化收入——这一数字此前未被报道过。

来自主题: AI资讯
7984 点击    2025-11-27 14:37
学生3年投稿6次被拒,于是吴恩达亲手搓了个评审Agent

学生3年投稿6次被拒,于是吴恩达亲手搓了个评审Agent

学生3年投稿6次被拒,于是吴恩达亲手搓了个评审Agent

科研人不容易。3年投稿6次全被拒,每次等反馈要半年??机器学习大佬吴恩达听说这位学生的“水逆”遭遇后,亲手搓了个免费的AI论文评审智能体出来。通过在ICLR 2025审稿数据上训练系统,并在测试集中对比发现,该AI审稿系统与人类审稿的相关系数达0.42,和人与人审稿间的0.41相近甚至还高一点。

来自主题: AI资讯
8130 点击    2025-11-25 17:17
Z Potentials|专访TestSprite创始人,前AWS&Google工程师,打造全球4万开发者的测试Agent

Z Potentials|专访TestSprite创始人,前AWS&Google工程师,打造全球4万开发者的测试Agent

Z Potentials|专访TestSprite创始人,前AWS&Google工程师,打造全球4万开发者的测试Agent

这两年,写代码这件事变了。GitHub Copilot、Cursor、Devin 一路登场,工程师开始习惯“打一段话,几千行代码自己长出来”。写得出东西,变得前所未有地容易。但很快大家发现,真正拖住上线节奏的,不再是「能不能写出来」,而是「敢不敢放上生产环境」——代码量指数级增长,验证、回归、极端场景覆盖反而被彻底压缩,测试成了 AI 时代新的“硬瓶颈”。

来自主题: AI资讯
9440 点击    2025-11-25 17:16
2.4万亿参数原生全模态,文心5.0一手实测来了

2.4万亿参数原生全模态,文心5.0一手实测来了

2.4万亿参数原生全模态,文心5.0一手实测来了

刚刚,文心5.0正式发布了!全新一代主打原生全模态,最开始就把语言/图像/视频/音频放在同一套自回归统一架构里,做统一的理解与生成训练。所以,最终模型能够做到支持全模态输入(文字/图片/音频/视频)+全模态输出(文字/图片/音频/视频),创意写作、指令遵循、智能体规划方面也更强了。

来自主题: AI资讯
9177 点击    2025-11-13 21:01