AI资讯新闻榜单内容搜索-EVI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: EVI
ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

本文综合北京大学王选计算机研究所发布的 ProactiveVideoQA 和 MMDuet2 两篇论文,介绍视频多模态大模型如何实现 “主动交互”—— 在视频播放过程中自主决定何时发起回复,而非等待用户提问。ProactiveVideoQA 提出评估指标和 benchmark,MMDuet2 则通过强化学习训练方法实现了 SOTA 性能,无需精确的回复时间标注即可训练出及时、准确的主动交互模型。

来自主题: AI技术研报
8238 点击    2026-03-30 15:02
Kollab 想把 AI 变成团队操作系统,从个人提效到组织复利

Kollab 想把 AI 变成团队操作系统,从个人提效到组织复利

Kollab 想把 AI 变成团队操作系统,从个人提效到组织复利

最近一段时间,AI 产品的演进路径逐渐收敛到一个方向:如何让个体更高效。从自动写代码的 Devin,到嵌入各类办公软件的 Copilot,这些工具不断刷新个人生产力的上限,让“一个人完成更多事”成为现实,但问题是个体效率提升,并不等于团队效率同步提升。

来自主题: AI资讯
9316 点击    2026-03-26 12:00
科研数据不再碎片化!一张可计算图,连起整个科研世界

科研数据不再碎片化!一张可计算图,连起整个科研世界

科研数据不再碎片化!一张可计算图,连起整个科研世界

UIUC研究团队打造ResearchArcade,将ArXiv论文、OpenReview评审、图表代码等碎片数据连接成动态知识图谱。模型可直接学习引用关系、修改轨迹与审稿互动,让AI更好辅助科研写作、修订与预测,为下一代科研智能体奠定统一数据基础。

来自主题: AI技术研报
7657 点击    2026-03-24 16:30
林俊旸离职后,阿里Qwen3.5首次发新

林俊旸离职后,阿里Qwen3.5首次发新

林俊旸离职后,阿里Qwen3.5首次发新

今日,阿里千问最新旗舰模型预览版Qwen3.5-Max-Preview正式亮相,并登上全球大模型评测平台LMArena。在最新榜单中,该模型拿下1464分,进入第一梯队,同时带动阿里千问跻身全球大模型实验室前五、国内第一。

来自主题: AI资讯
7890 点击    2026-03-20 14:40
刚刚,全球视频模型新王诞生了!SkyReels-V4登顶Artificial Analysis文转视频(含音频)全球榜

刚刚,全球视频模型新王诞生了!SkyReels-V4登顶Artificial Analysis文转视频(含音频)全球榜

刚刚,全球视频模型新王诞生了!SkyReels-V4登顶Artificial Analysis文转视频(含音频)全球榜

来自天工AI的SkyReels-V4,没打招呼,直接登顶Artificial Analysis文转视频(含音频)全球榜,超越Veo 3.1、Sora 2。一个月前,其Preview版本才刚拿下该榜全球第2。

来自主题: AI资讯
8026 点击    2026-03-19 11:52
Karpathy:写了20年代码,现在像作弊

Karpathy:写了20年代码,现在像作弊

Karpathy:写了20年代码,现在像作弊

vibe coding这个词,是一年前Karpathy造的,现在他自己不用了。110次实验,AI Agent自主跑完,全程没碰键盘,顺带还搭了套家庭监控分析系统。Box CEO Levie看完说了一句话:专家不会消失,但专家能做到的事,边界变了。

来自主题: AI资讯
7658 点击    2026-03-16 09:36
谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA

谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA

谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA

谷歌发布首个原生全模态 Embedding 模型 Gemini Embedding 2!它将文本、图、音视频及 PDF 无损融于统一向量空间,实现跨越五大模态的直接检索。这极大降低了架构成本,赋予了 AI 真正连贯的「记忆」,是重塑 AI 基建的里程碑。

来自主题: AI资讯
9085 点击    2026-03-12 10:21
为什么顶尖投行都选择了 Rogo 这个金融 Agent?

为什么顶尖投行都选择了 Rogo 这个金融 Agent?

为什么顶尖投行都选择了 Rogo 这个金融 Agent?

全球投行业每年处理超过 3.5 万亿美元的交易,但驱动这台庞大机器运转的,是数以万计每周工作超过百小时、从事着高度重复性劳动的初级分析师。Vertical Agent 开始加速很多专业领域的工作流,比如法律领域的 Harvey、医疗领域的 OpenEvidence,而在离钱最近的金融领域迟迟未能出现一款真正的统治级应用。

来自主题: AI资讯
6876 点击    2026-03-06 10:10
4000万美元!红杉美国和NEA抢投AI医疗公司Anterior

4000万美元!红杉美国和NEA抢投AI医疗公司Anterior

4000万美元!红杉美国和NEA抢投AI医疗公司Anterior

Anterior,刚刚完成了 4000 万美元的融资,使其总融资额达到 6400 万美元。这轮融资由 NEA 和 Sequoia Capital 继续参与,新投资者包括 FPV 和 Kinnevik。但让我真正感兴趣的不是融资金额本身,而是他们正在解决的问题以及他们解决问题的方式。

来自主题: AI资讯
8767 点击    2026-02-27 12:02
刚刚,Seedream 5.0上线!字节又一新模型

刚刚,Seedream 5.0上线!字节又一新模型

刚刚,Seedream 5.0上线!字节又一新模型

新模型对标Nano Banana Pro,能免费体验。Seedance 2.0的热度还没下去,字节新模型又来了!今日,字节图像生成模型Seedream 5.0 Preview在视频编辑应用剪映、剪映海外版Capcut、字节AI创作平台小云雀均已上线,在即梦AI平台开启灰度测试,图片生成可限时免费体验。

来自主题: AI资讯
8126 点击    2026-02-10 14:38