谷歌新架构突破Transformer超长上下文瓶颈!Hinton灵魂拷问:后悔Open吗?
谷歌新架构突破Transformer超长上下文瓶颈!Hinton灵魂拷问:后悔Open吗?两项关于大模型新架构的研究一口气在NeurIPS 2025上发布,通过“测试时训练”机制,能在推理阶段将上下文窗口扩展至200万token。两项新成果分别是:Titans:兼具RNN速度和Transformer性能的全新架构;MIRAS:Titans背后的核心理论框架。
两项关于大模型新架构的研究一口气在NeurIPS 2025上发布,通过“测试时训练”机制,能在推理阶段将上下文窗口扩展至200万token。两项新成果分别是:Titans:兼具RNN速度和Transformer性能的全新架构;MIRAS:Titans背后的核心理论框架。
一直以来,传统 MAS 依赖自然语言沟通,各个 LLM 之间用文本交流思路。这种方法虽然可解释,但冗长、低效、信息易丢失。LatentMAS 则让智能体直接交换内部的隐藏层表示与 KV-cache 工作记忆,做到了:
能写作策划、能生成PPT,还能在线编辑,最关键的是:还能白嫖~刚刚,阿里千问悄悄把办公和写作能力升级了一遍:文档生成、智能排版、在线编辑、多格式转换全都打包进一个入口里:
在 Text-to-Video / Image-to-Video 技术突飞猛进的今天,我们已经习惯了这样一个常识: 视频生成的第一帧(First Frame)只是时间轴的起点,是后续动画的起始画面。
优理奇机器人(UniX AI)近日宣布完成两轮合计3亿元天使++++轮及天使+++++轮融资,由川商基金、吴中金控、益华资本、青域基金、太浩创投等机构,以及若干上市公司及产业方参与投资,老股东赛纳资本追加投资。
作者在包含 50 多个任务的多个仿真和真实世界场景中评估了 SpatialActor。它在 RLBench 上取得了 87.4% 的成绩,达到 SOTA 水平;在不同噪声条件下,性能提升了 13.9% 至 19.4%,展现出强大的鲁棒性。目前该论文已被收录为 AAAI 2026 Oral,并将于近期开源。
DeepWisdom研究团队提出:视频生成模型不仅能画画,更能推理。 为了验证这一观点,团队推出了VR-Bench——这是首个通过迷宫任务评估视频模型空间推理(spatial reasoning)能力的基准测试
一年一度的英伟达奖学金出炉了。二十五年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。
这篇学术论长文由北京航空航天大学复杂关键软件环境全国重点实验室领衔。《From Code Foundation Models to Agents and Applications》一文是对过去几年代码智能领域的一次系统梳理:模型、任务、训练、智能体、安全与应用都被串联成了一条完整、连贯的技术链路。
2025 年 12 月,硅谷风险投资机构 Andreessen Horowitz(简称 a16z)与 AI 推理服务平台 OpenRouter 联合发布了一份名为《State of AI》的研究报告。这份报告基于 OpenRouter 平台上超过 100 万亿 token 的真实用户交互数据,试图呈现过去一年间大语言模型在实际应用中的真实状态。
确实也是轰动数学和AI两界了。因为就在最近,世界级顶尖数学家宣布辞职,前往硅谷,全职加入AI初创公司——这家公司,还是自己学生创办的——一个24岁00后华人女生。吸引他的这家公司,也不是等闲之辈,而是硅谷新贵——Axiom,一家主打AI数学的明星公司。
来自中国的初创团队词元无限给出了自己的答案。由清华姚班校友带队设计开发的编码智能体 InfCode,在 SWE-Bench Verified 和 Multi-SWE-bench-CPP 两项非常权威的 AI Coding 基准中双双登顶,力压一众编程智能体。
近日,AI 初创公司 Axiom 宣布其模型在没有人类干预的情况下,自动完成了两个数学猜想的证明——埃尔德什问题(Erdős Problem)中的 481 号和 124 号。据称,481 号问题仅用时 5 小时,代码量为 656 行;124 号问题则耗时超 24 小时。值得关注的是,这些证明均通过 Lean 验证,Lean 的特点是其形式化证明过程无需人工干预,为数学正确性提供了保障。
阿蒂从洛杉矶飞来,谈论他的初创公司上周发布的重磅消息。Klay 已与各大唱片公司——环球音乐集团、华纳音乐集团和索尼音乐—— 达成批准上市许可/注册协议 ,成为首家与这三巨头全部签约的人工智能初创企业。
Anthropic发布了Programmatic Tool Calling(PTC)特性,让Claude通过代码编排工具执行,降低token消耗、减少延迟并提升准确性。
全球首个可大规模落地的开源原生多模态架构(Native VLM),名曰NEO。要知道,此前主流的多模态大模型,例如我们熟悉的GPT-4V、Claude 3.5等,它们的底层逻辑本质上其实玩的就是拼接。
当地时间12月4日下午,谷歌研究员的一篇论文在现场引来了超多AI爱好者的围观。甚至,被业界专家视为“为AGI发展提供了新框架”,一位人士评价为:这篇论文将成为逐步推动实现AGI的5~10篇论文中的一篇。
太劲爆了!不过半月,谷歌DeepMind终于放出了IMO最强金牌模型——Gemini 3 Deep Think。今天,Gemini 3 Deep Think已在Gemini App上线,所有Ultra用户即可体验。
游戏进入下半场,阿彪说,他想让 Pollo AI 成为 AI 时代的剪映。
硬氪独家获悉,前安克创新全球CMO、中国区总裁王时远离职后创业,成立「穗升科技」;公司聚焦AI录音硬件赛道,依托软硬件结合方案实现记忆管理与行动的闭环。
“豆包手机”刚发售,火到3万台首批备货被一抢而空。
“帮助全世界 40 万人成为导演,这种成就感,比我自己拍一部电影要大得多。”
在过去几年里,AI 技术经历了爆发式的增长,它正以极快的速度影响各行各业。然而,这场技术浪潮并未平等地惠及每一个人。
键盘作为人机交互的主要工具,实质上是一个巨大且不自然的「输入、输出瓶颈」。在「后键盘时代(post-keyboard future)」,语音或许才是最好地交互方式。
在生成式 AI 的新时代,人们一直在讨论它会不会颠覆教育、改变编程、重塑工作方式——但你可能没想到:现在连 6 岁的小孩都能通过AI 变成“侵权生成器”了。
芯片速度触顶,AI却在疯狂跃迁。摩尔定律不管用了!Nature最新文章给出一个颠覆直觉的解释:智能的增长不靠芯片,而是结构被重新组织,更多单元被接入同一套协作网络。
去年,美国有49家AI创业公司完成了1亿美元以上的融资。按常理,这样的数字意味着高基数、难再现。但今年的市场依旧火热,据TechCrunch的最新发布,进入年底前的最后几周,2025年已经追平去年,甚至出现更多的头部公司连续获得多轮 1亿美元以上的融资。
大模型总是无法理解空间,就像我们难以想象四维世界。
DeepSeek 一发布模型,总会引起业内的高度关注与广泛讨论,但也不可避免的暴露出一些小 Bug。
想象一下这个场景: 一个寂静的深夜,你满怀期待对游戏里的AI说:“去睡觉吧”,它却径直走向餐厅,在椅子坐下了;你再次尝试:“帮我暖一下被窝?”它用合成语音温柔地回应“好的”,身体却僵在洗手间,纹丝不动。