DeepSeek、GPT、Qwen,所有大模型架构图都有,Karpathy:宝藏画廊!
DeepSeek、GPT、Qwen,所有大模型架构图都有,Karpathy:宝藏画廊!最近几年,大模型赛道好不热闹。
最近几年,大模型赛道好不热闹。
3月16日阿里内部围绕“Token”链路,重新梳理整合了业务架构,并成立了新事业群:Alibaba Token Hub(ATH)事业群,阿里巴巴CEO吴泳铭将直接负责这个事业群。这也是自阿里内部电商事业群整合以来,最重要的一次架构调整。
就在刚刚,Moonshot AI(月之暗面)发布了一项足以撼动 Transformer 底层的研究:《Attention Residuals》。海外科技大 V,谷歌高级AI产品经理 Shubham Saboo 直接开启了“高赞”模式:“他们触碰了那个十年没人敢碰的部分。”
黑暗启蒙运动在硅谷的标志性人物——彼得·蒂尔,将于这几天在罗马开展一系列绝密讲座,驳斥教皇观点,反对 AI 监管,这或许标志着 AI 竞争的终局较量已经拉开帷幕。各大巨头想要争夺的标的,已经超越了算力规模与爆款应用。他们真正在抢夺的,是对「未来秩序」的最终解释权。
近年来,多模态大模型(Multimodal Large Language Models, MLLMs)正在迅速改变人工智能的能力边界。从图像理解到视频分析,从语音对话到复杂推理,大模型正在逐步具备类似人类的综合感知能力。但一个关键问题仍然没有得到充分回答:这些模型真的能够理解人类情绪吗?
全网震撼!0生物学背景,澳洲大神为救回患癌爱犬,竟用ChatGPT+AlphaFold,设计出全球首支定制mRNA疫苗。短短数周,肿瘤缩小50%。这预示着,AI正加速攻克癌症的终极圣杯。
根据Xsignal AI Holo(AI全息)数据库数据显示,2026年初的AI细分行业数据,如果说“活跃用户量”代表了用户的使用意愿,那么“使用时长”则揭示了真实的市场依存度。基于这两项指标的交叉分析,市场已出现严重的结构性分化:
谷歌DeepMind又放大招了:AlphaEvolve自主写算法,一口气改写5个经典拉姆齐数下界,打破了尘封十年的数学纪录!诺奖得主Hassabis和图灵奖得主LeCun都纷纷点赞——AI,正在彻底改变数学突破的方式!
3 月 12 日凌晨,Perplexity 在旧金山 North Beach 一座改建自教堂的场地里,开了首届 Ask 2026 开发者大会,发布了 Personal Computer(个人电脑)。Personal Computer 是在此基础上往前迈了一大步。它运行在你自备的 Mac mini 上,24 小时不间断地访问本地文件、应用和会话记录,把云端的推理能力和本地数据的访问权限真正打通。
近期,复旦大学 NLP 实验室(FDU NLP)、北京大学知识计算实验室(KCL)联合美团 LongCat Team 提出了一种 Block Diffusion 推理模型 Test-Time Scaling 新框架 TDAR,通过引入 “粗思考,细求证” (Think Coarse Critic Fine, TCCF) 范式与有界自适应置信度解码