AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

杜克大学和 Adobe 最近发布的 VERA 研究,首次系统性地测量了语音模态对推理能力的影响。研究覆盖 12 个主流语音系统,使用了 2,931 道专门设计的测试题。

来自主题: AI技术研报
6655 点击    2025-10-18 12:08
动作波动率降低70%!清华发布工业控制专用神经网络模型 | TIV'25

动作波动率降低70%!清华发布工业控制专用神经网络模型 | TIV'25

动作波动率降低70%!清华发布工业控制专用神经网络模型 | TIV'25

在机器人与自动驾驶领域,由强化学习训练的控制策略普遍存在控制动作不平滑的问题。这种高频的动作震荡不仅会加剧硬件磨损、导致系统过热,更会在真实世界的复杂扰动下引发系统失稳,是阻碍强化学习走向现实应用的关键挑战。

来自主题: AI技术研报
7463 点击    2025-10-18 11:54
ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体

ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体

ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体

在今年的国际计算机视觉大会(ICCV 2025)上,来自浙江大学、香港中文大学、上海交通大学和上海人工智能实验室的研究人员联合提出了第一人称联合预测智能体 EgoAgent。

来自主题: AI技术研报
7120 点击    2025-10-18 11:48
Sora2还在5秒打转,字节AI生视频已经4分钟“起飞”

Sora2还在5秒打转,字节AI生视频已经4分钟“起飞”

Sora2还在5秒打转,字节AI生视频已经4分钟“起飞”

从5秒到4分钟,Sora2也做不到的分钟级长视频生成,字节做到了!这就是字节和UCLA联合提出的新方法——Self-Forcing++,无需更换模型架构或重新收集长视频数据集,就能轻松生成分钟级长视频,也不会后期画质突然变糊或卡住。

来自主题: AI技术研报
7137 点击    2025-10-18 11:36
全球第一,最强OCR之神诞生!百度这个0.9B开源模型问鼎SOTA

全球第一,最强OCR之神诞生!百度这个0.9B开源模型问鼎SOTA

全球第一,最强OCR之神诞生!百度这个0.9B开源模型问鼎SOTA

百度登顶全球第一!最新模型「PaddleOCR-VL」以0.9B参数量,在全球权威榜单OmniDocBench V1.5中以92.6分夺得综合性能第一,横扫文本识别、公式识别、表格理解与阅读顺序四项SOTA。

来自主题: AI资讯
7995 点击    2025-10-17 21:46
谷歌×耶鲁联手发布抗癌神器!AI推理精准狙击「隐身」癌细胞

谷歌×耶鲁联手发布抗癌神器!AI推理精准狙击「隐身」癌细胞

谷歌×耶鲁联手发布抗癌神器!AI推理精准狙击「隐身」癌细胞

近日,谷歌与耶鲁大学联合发布的大模型C2S-Scale,首次提出并验证了一项全新的「抗癌假设」。这一成果表明,大模型不仅能复现已知科学规律,还具备生成可验新科学假设的能力。

来自主题: AI技术研报
6717 点击    2025-10-17 16:35
苏姿丰出手!Oracle下单5万颗AMD芯片,英伟达王座撼动

苏姿丰出手!Oracle下单5万颗AMD芯片,英伟达王座撼动

苏姿丰出手!Oracle下单5万颗AMD芯片,英伟达王座撼动

AMD再下一城!Oracle宣布自2026年第三季度起,将在其云基础设施(OCI)部署5万颗AMD Instinct™ MI450系列GPU,构建全新AI超级集群,并计划持续扩容。此举标志着AMD与Oracle的合作迈入新阶段,也被视为AMD在打破英伟达长期主导的AI算力生态中的又一关键突破。

来自主题: AI资讯
6050 点击    2025-10-17 16:21
递归语言模型登场!MIT华人新作爆火,扩展模型上下文便宜又简单

递归语言模型登场!MIT华人新作爆火,扩展模型上下文便宜又简单

递归语言模型登场!MIT华人新作爆火,扩展模型上下文便宜又简单

目前,所有主流 LLM 都有一个固定的上下文窗口(如 200k, 1M tokens)。一旦输入超过这个限制,模型就无法处理。 即使在窗口内,当上下文变得非常长时,模型的性能也会急剧下降,这种现象被称为「上下文腐烂」(Context Rot):模型会「忘记」开头的信息,或者整体推理能力下降。

来自主题: AI资讯
6838 点击    2025-10-17 16:12