AI资讯新闻榜单内容搜索-AI新闻

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI新闻
把Agent丢入1000+文件:人大CoDA-Bench揭示Code Agent瓶颈

把Agent丢入1000+文件:人大CoDA-Bench揭示Code Agent瓶颈

把Agent丢入1000+文件:人大CoDA-Bench揭示Code Agent瓶颈

中国人民大学的研究团队提出 CoDA-Bench,联合评估 Agent 的 Code Intelligence + Data Intelligence。该基准首次把 Code Agent 放进包含 1000 + 数据文件的复杂环境下,要求模型先自主探索文件系统、找到相关数据,再编写代码完成分析。实验显示,即使当前表现最好的系统,在 CoDA-Bench 上执行准确率也只有 61.1%;

来自主题: AI技术研报
8984 点击    2026-07-04 10:51
ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

LinStereo 对应地做了三件事:PALA 换掉 ConvGRU 解决传播问题,HSCV 保留多尺度特征,DPI 用单目深度给一个靠谱的起点。PALA 做的事情说起来很直观,就是把 ConvGRU 的局部更新换成全局注意力,让每个像素每次迭代都能看到整张图。难点在于 softmax attention 是 O (N²) 的,直接用在高分辨率视差图上跑不动。

来自主题: AI技术研报
8139 点击    2026-07-04 10:50
AI Agent为什么总是不稳定?终于有了一个系统性基准来拆解

AI Agent为什么总是不稳定?终于有了一个系统性基准来拆解

AI Agent为什么总是不稳定?终于有了一个系统性基准来拆解

三星大模型团队联合北京大学、香港城市大学、香港科技大学等科研机构,共同发布了面向 AI Agent 的基准测试 LiveClawBench。它关注的并不是「谁的 Agent 更强」,而是一个更基础、也更关键的问题:为什么同一个 AI Agent,在一些任务中已经接近可用,而在另一些任务中却会突然失稳?

来自主题: AI技术研报
7164 点击    2026-07-04 10:50
AI 能做一百件事,就做不了一个好看的 PPT

AI 能做一百件事,就做不了一个好看的 PPT

AI 能做一百件事,就做不了一个好看的 PPT

埃森哲的 AI 策略负责人最近在一次内部会议上,吐槽了公司里消耗 AI 算力的情况:驱动 token 消耗的,不是工程师在做开发,是非技术人员在用 AI 把 PDF 转成 PPT。 这怎么是滥用呢?堂堂埃森哲一个咨询公司,做 PPT 才是正经事啊!

来自主题: AI资讯
7291 点击    2026-07-04 10:49
只用15%数据,多模态指令微调反超全量训练15.8%!

只用15%数据,多模态指令微调反超全量训练15.8%!

只用15%数据,多模态指令微调反超全量训练15.8%!

来自上海交大、马来亚大学、CMU、MBZUAI、KIT和KAUST的团队提出VisNec(Visual Necessity Score,视觉必要性分数),用一个分数衡量每条训练样本里“图像到底起了多大作用”,被ECCV 2026收录。

来自主题: AI技术研报
7640 点击    2026-07-04 10:47
突发!Anthropic拟全面封禁地下通道

突发!Anthropic拟全面封禁地下通道

突发!Anthropic拟全面封禁地下通道

史上最严厉的一次清洗来了。就在昨天,外媒Financial Times突然曝出消息:Anthropic正在全面下狠手,疯狂清剿允许绕过限制访问Claude的所有地下通道!

来自主题: AI资讯
9393 点击    2026-07-04 10:20
DeepSeek新技术移植苹果芯片!Mac本地大模型加速60%

DeepSeek新技术移植苹果芯片!Mac本地大模型加速60%

DeepSeek新技术移植苹果芯片!Mac本地大模型加速60%

DSpark刚开源一周,就被搬进了苹果电脑。移植版本叫mlx-dspark,跑的是Gemma-4 12B和Qwen3-4B这两个模型。装上之后,这两个模型在Mac上的生成速度分别提了1.6倍和1.4倍。

来自主题: AI资讯
8890 点击    2026-07-03 21:58
绝了! Claude Fable5惨遭二次越狱,黑客20小时撬开神话防线

绝了! Claude Fable5惨遭二次越狱,黑客20小时撬开神话防线

绝了! Claude Fable5惨遭二次越狱,黑客20小时撬开神话防线

Fable 5再次被越狱了!这已经是该模型第二次防线失守。黑客Vitto Rivabella,公开宣布:Fable 5,又被攻破了。要知道,Claude Fable 5恢复访问时,Anthropic特意强调:上次Fable 5被禁就是因为亚马逊的研究人员发现了一种绕过Fable 5安全防护的方法。

来自主题: AI资讯
8748 点击    2026-07-03 18:43
Anthropic被曝造芯!挖OpenAI老兵,密谈三星2nm

Anthropic被曝造芯!挖OpenAI老兵,密谈三星2nm

Anthropic被曝造芯!挖OpenAI老兵,密谈三星2nm

刚刚,The Information爆出:Anthropic已启动自研AI芯片的早期工作,并与三星电子讨论潜在的代工合作。据知情人士称,考虑中的选项包括三星的2nm制程和先进封装。

来自主题: AI资讯
9920 点击    2026-07-03 16:14
今天刚听完的硅谷 AI 工程师实践分享:AI agent 到底怎么才算真正落地

今天刚听完的硅谷 AI 工程师实践分享:AI agent 到底怎么才算真正落地

今天刚听完的硅谷 AI 工程师实践分享:AI agent 到底怎么才算真正落地

今晚,我在旧金山 Howard Street 的 Inngest 总部,参加了一场叫做 {AI} in Production 的小型聚会。主办方是 Inngest,Cursor、Arcade、Vapi 联合参与。清一色是在一线真正跑 AI agent 的工程师和创始人,一群人坐在一起,讲他们把 AI 部署进生产环境之后遇到的真实问题。

来自主题: AI资讯
8419 点击    2026-07-03 16:13