仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了
仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了为什么大模型厂商给了 128K 的上下文窗口,却在计费上让长文本显著更贵?
为什么大模型厂商给了 128K 的上下文窗口,却在计费上让长文本显著更贵?
想用3D高斯泼溅(3DGS)重建一座城市?
刚刚,彼得·蒂尔一句话捅破天花板:AI芯片最终不会稀缺,将沦为白菜价。当AMD、ASIC、TPU、Trainium联手围剿,英伟达的暴利时代正在倒计时。
老粉都知道,咱们特工宇宙和扣子团队有多熟悉。
“我希望留下一个能被世界铭记的作品。”
应「知乎AI中场时刻」邀约,来做个年终回顾
Agent成下一代技术主体,如何为其“修路架桥”?
MiniMax最新旗舰级Coding & Agent模型M2.1,刚刚对外发布了。这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
AI 也要来帮你总结过去的一年了! 今年,ChatGPT 官方首次上线了名为「Your Year with ChatGPT」的年度回顾功能。 谁能领取这份年度报告? 目前,这项功能主要面向美国、英国、加拿大、新西兰和澳大利亚,且运行最新版本 ChatGPT 应用的用户推出。
抽奖式的生图体验,确实让很多设计师在尝鲜之后又默默打开了 Photoshop。于是乎,阿里千问团队再次出手,开源了一个叫 Qwen-Image-Layered 的模型,试图从底层逻辑上解决这个问题。