腾讯发布SpecExit算法,无损压缩端到端加速2.5倍!解决大模型长思考效率难题
腾讯发布SpecExit算法,无损压缩端到端加速2.5倍!解决大模型长思考效率难题为破解大模型长思维链的效率难题,并且为了更好的端到端加速落地,我们将思考早停与投机采样无缝融合,提出了 SpecExit 方法,利用轻量级草稿模型预测 “退出信号”,在避免额外探测开销的同时将思维链长度缩短 66%,vLLM 上推理端到端加速 2.5 倍。
为破解大模型长思维链的效率难题,并且为了更好的端到端加速落地,我们将思考早停与投机采样无缝融合,提出了 SpecExit 方法,利用轻量级草稿模型预测 “退出信号”,在避免额外探测开销的同时将思维链长度缩短 66%,vLLM 上推理端到端加速 2.5 倍。
加州大学伯克利分校的研究团队提出了一种AI驱动的系统研究方法ADRS(AI-Driven Research for Systems),它可以通过“生成—评估—改进”的迭代循环,实现算法的持续优化。
10月24日消息,今日,谷歌Anthropic发布声明,宣布谷歌将向Anthropic供应至多100万块专用AI芯片TPU以及附加的谷歌云服务,这笔交易价值数百亿美元。谷歌在声明中称,这是Anthropic迄今为止规模最大的TPU扩容计划。至此,Anthropic已与谷歌、亚马逊与英伟达三大芯片提供商达成合作。
OpenAI全新收购曝光,曾为Mac开发自然语言交互界面——Sky——的公司如今成了GPT生态的一员。作为交易的一部分,OpenAI将把Sky的技术整合进ChatGPT,并吸纳这支约12人的团队。
世界在AI眼中活了过来!谷歌Grounding with Google Maps功能上线,Gemini可调用2.5亿地点信息,结合搜索工具,提供更准确、更及时的答案,完美适用于旅行规划和本地服务。
这个双十一,终于可以把人形机器人放入购物车了。今年,还有一件「意想不到」的商品悄悄加入——不是模型,也不是玩具,而是真·能走能跑、能跟你聊天、还能跳舞的人形机器人。
在最近一篇来自Meta FAIR团队的论文里,研究者找到了一种前所未有的方式——他们能实时看到AI的思考过程。这项名为CRV的方法,通过替换模型内部的MLP模块,让每一步推理都变得「可见」。这不是隐喻,而是可量化的现象。Meta用它让错误检测精度提升到92.47%,也让人类第一次得以窥见AI是怎么想错的。
TechCrunch 报道,之前一直以 AI 语音初创公司示人的 Sesame,完成了 2.5 亿美元的 B 轮融资,投资方包括红杉资本、Spark Capital 及其他未公开的投资者。随后,Sesame 创始人 Brendan Iribe 也在个人社媒账号上发帖,证实该消息。
全球六大LLM实盘厮杀,新王登基!今天,Qwen3 Max凭借一波「快狠准」操作,逆袭DeepSeek夺下第一。Qwen3 Max,一骑绝尘! 而GPT-5则接替Gemini 2.5 Pro,成为「最会赔钱」的AI。照目前这个趋势,估计很快就要跌没了……
羡慕现在搞AI的大家。去一下学术顶会,工作机会现场就来了。是的,大厂AI招聘的风,已经吹到ICCV 2025。而今年的ICCV一逛,我们还真看到了点不一样的花活——顶会直聘。