GLM-5 技术报告全解读|a16z:“最好的开源模型”
GLM-5 技术报告全解读|a16z:“最好的开源模型”a16z 昨天发了一张图,把 GLM-5 和 Claude Opus 4.6 并排标注在 Artificial Analysis Intelligence Index 的时间线上。原文的说法是: A proprietary model (Claude Opus 4.6) is still the 'most intelligent,' but the gap between
a16z 昨天发了一张图,把 GLM-5 和 Claude Opus 4.6 并排标注在 Artificial Analysis Intelligence Index 的时间线上。原文的说法是: A proprietary model (Claude Opus 4.6) is still the 'most intelligent,' but the gap between
在最近一期 TechCrunch 的《Equity》播客节目中,负责谷歌云全球初创业务的副总裁 Darren Mowry 指出,以这些为卖点的初创公司,已经亮起了「引擎故障灯」。
刚刚,Anthropic发布代码安全工具Claude Code Security,直接让安全股一夜蒸发百亿市值!网络安全龙头CrowdStrike的股价直接原地跌超6.5%,市场陷入极度恐慌:传统安全工具,从此全凉了?
智谱的股价在尾盘直线拉升,单日涨幅达到惊人的 42.72%,总市值一举冲破 3200 亿港元大关;而同样刚刚上市仅仅 43 天的 MiniMax,同样录得超过 14%的涨幅,市值稳稳站上 3000 亿港元的台阶。
最近Cursor 发布了 Composer 1.5。这一版把强化学习规模扩大了 20 倍,后训练计算量甚至超过了基座模型的预训练投入。还加了 thinking tokens 和自我摘要机制,让模型能在复杂编程任务里做更深度的推理。
双十一需要瞬间扩容3-5倍人力,春节却是全员真空,百融云创的硅基员工却在两种极端场景中无缝切换:从峰值「强力补充」到假期「全量值守」,真正证明了AI不是工具,而是数字化劳动力。
在很多大模型和 Agent 的训练里,最常见的一种做法就是只看结果:最后答案对了就给奖励,错了就当 0 分。 在单轮问答里,这样「只看结果」还勉强能用;可一旦换成 Agent 这种要多轮对话、搜索、刷
由知名恋爱手游《奇点时代》研发商 CEO 张筱帆带头打造的 AI 男友「EVE」在年中释出 PV;明星创业者张月光打造的《星眠》也在年底透过内测首次与公众见面;我们还发现市值一度超过 180 亿美元的自动驾驶明星公司图森未来转也型做了 AI 陪伴产品「Breath of You」,尽管该产品目前已官宣停服。
最新消息显示,奥特曼已将公司核心资源从探索性的长线研究(Blue-sky research)全面倾斜至旗舰产品ChatGPT的工程化改进。这一战略调整,导致包括前研究副总裁Jerry Tworek在内的多位核心元老因理念分歧而心寒出走。
来自阿里高德的一篇最新 ICLR 2026 中稿论文《Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models》提出了面向文生图空间智能的系统性评估基准 SpatialGenEval,旨在通过长文本、高信息密度的 T2I prompt 设计,以及围绕空间感知