AI资讯新闻榜单内容搜索-Al

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Al
ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型,通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而,这些模型普遍存在一个核心问题,即过度思考(overthinking) :

来自主题: AI技术研报
6365 点击    2026-05-12 14:31
一人公司年入600万:他辞掉OpenAI的工作,押注了这件事

一人公司年入600万:他辞掉OpenAI的工作,押注了这件事

一人公司年入600万:他辞掉OpenAI的工作,押注了这件事

「一个人现在可以跑出一家30人公司才能完成的收入。」然后他说:这句话在2022年不成立。在2024年中段某个时间点,变成了真的。而且差距每个季度都在扩大。不是因为这个说法多新鲜——AI能提效这件事大家都听说过了。是因为他不只是说「理论上可以」,他是说他自己做到了,然后顺手把操作手册拿出来给你看。

来自主题: AI资讯
7514 点击    2026-05-12 09:58
速递|Salesforce前CEO再创业,Sierra瞄准企业AI市场,估值150亿美元

速递|Salesforce前CEO再创业,Sierra瞄准企业AI市场,估值150亿美元

速递|Salesforce前CEO再创业,Sierra瞄准企业AI市场,估值150亿美元

布雷特·泰勒创立的 AI 初创公司 Sierra 正在完成一轮由 Tiger Global 和 GV 领投的 9.5 亿美元融资,该公司周一宣布 ,其投后估值已突破 150 亿美元。这笔融资使 Sierra 可动用的资金超过 10 亿美元——该公司表示将利用这笔资金成为 AI 驱动客户体验的"全球标准"。

来自主题: AI资讯
6731 点击    2026-05-12 09:19
Siggraph 26 | 视频版Vision-Banana来了?大一统框架UniVidX刷新多项视频任务SOTA

Siggraph 26 | 视频版Vision-Banana来了?大一统框架UniVidX刷新多项视频任务SOTA

Siggraph 26 | 视频版Vision-Banana来了?大一统框架UniVidX刷新多项视频任务SOTA

近日,由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报
9652 点击    2026-05-12 08:53
大厂让程序员卷 AI,4 个月烧掉全年预算,CTO 懵了

大厂让程序员卷 AI,4 个月烧掉全年预算,CTO 懵了

大厂让程序员卷 AI,4 个月烧掉全年预算,CTO 懵了

四个月后,Uber 的 CTO Praveen Neppalli Naga 向管理层汇报了一个令人尴尬的情况:公司为 2026 年全年准备的 AI 工具预算,已经在今年的前四个月,全部花完了。Uber 内部的数据是这样的:95% 的工程师每个月都在用 AI 编程工具。

来自主题: AI资讯
8566 点击    2026-05-11 21:11
ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

近年来,大模型能力提升的焦点正在从「训练时扩展」转向「推理时扩展」。从 Best-of-N、Self-Consistency 到更复杂的搜索与验证框架,Test-Time Scaling 已经成为提升大模型复杂推理能力的重要范式。

来自主题: AI技术研报
5691 点击    2026-05-11 16:09
Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Claw-Eval-Live提出「活的」benchmark概念,通过信号采集与任务筛选,确保评测内容紧跟企业实际痛点,而非固定不变的题库。评测不仅关注结果,还追踪执行过程,从数据调用到状态变更,全面验证Agent的真实能力。

来自主题: AI技术研报
6114 点击    2026-05-11 16:08
谷歌DeepMind聘请芝大教授担任AGI经济总监:审视AI时代人的价值

谷歌DeepMind聘请芝大教授担任AGI经济总监:审视AI时代人的价值

谷歌DeepMind聘请芝大教授担任AGI经济总监:审视AI时代人的价值

DeepMind 刚上任的 AGI 经济学总监 Alex Imas 曾担忧 AI 导致失业和需求坍缩,如今提出一个谨慎乐观判断,AI 会压低可复制劳动价格,也会推高护理、教育、医疗、服务等关系型劳动的价值。

来自主题: AI资讯
5893 点击    2026-05-11 09:34
实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

我看到洛小山做的 Alice,在「观猹」上取得了高分 8.2 的成绩。这是一个免费的 AI 个人助理(接入词元跳动注册即送免费算力):她有完整的人设,26 岁澳门女生,会在凌晨提醒你早睡,还会私下「小声蛐蛐」对你的观察。

来自主题: AI产品测评
8116 点击    2026-05-10 22:14
刚刚,硅谷这篇文章刷屏了!

刚刚,硅谷这篇文章刷屏了!

刚刚,硅谷这篇文章刷屏了!

今天,硅谷一篇长文《The next biggest moat in AI》刷屏了,作者是 Foundation Capital 合伙人、前麦肯锡咨询师 Jaya Gupta。这篇文章在 X 上 12 小时获得了130万阅读,被一群创始人和打工人同时转发,原因是它同时提供了两套视角:

来自主题: AI资讯
8555 点击    2026-05-10 14:43