上市首日大涨111%!智谱MiniMax之后,德适交出大模型商业化最硬核答卷
上市首日大涨111%!智谱MiniMax之后,德适交出大模型商业化最硬核答卷这几天,港股市场的情绪,又被AI大模型点燃了!
这几天,港股市场的情绪,又被AI大模型点燃了!
Harness(驾驭)的风,终究还是从大模型,吹到了机器人!
Feeling AI要补齐的,是世界模型最被低估的一块拼图——动态交互的模型层能力。
在 AI 圈,模型至上论正在遭遇前所未有的挑战。当所有人都在屏息等待新模型再次刷新智力天花板时,AI 基础设施领军人物、LangChain 联合创始人 Harrison Chase 在最新对话中抛出了新预判:大模型正在沦为大宗商品,而决定 Agent 成败的,是那个包裹在模型外的 Harness 。
去年讨论Agent落地时,重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot,怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升,控制数据流向、工具调度和异常处理的底层脚手架代码,往往比单纯拼接文本对系统性能的影响更大。
3 月 31 日下午,技术圈炸了锅: Claude Code,这款被公认为当前最强的 AI 编程助手,因为一次内部失误,核心代码逻辑暴露在了全球开发者面前。
在现实世界中通过强化学习训练智能体,往往需要大量在线试错与环境探索,这不仅成本高昂,还可能带来显著安全风险:机器人可能因试错而损坏,自动驾驶的在线探索可能危及行车安全,而持续采集交互数据本身也代价巨大。
自从 30 号,Claude 传出最新的模型叫「卡皮巴拉」,愚人节的氛围就上来了。到后来 Claude Code 源码泄漏,更加是让互联网乱成一锅粥,赶紧喝了吧!
刚刚,谷歌正式发布 Gemma 4,称“这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计,采用商业许可的 Apache 2.0 许可证开源。Gemma 4 提供四种规格:Effective 2B(E2B)、Effective 4B(E4B)、26B 混合专家模型(MoE)和 31B 稠密模型(Dense)。
什么这code那code,先别code了,因为—— 中国最强编程模型来了!