刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」
刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。
就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。
如何理解大模型推理能力?现在有来自谷歌DeepMind推理负责人Denny Zhou的分享了。 就是那位和清华姚班马腾宇等人证明了只要思维链足够长,Transformer就能解决任何问题的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法,在斯坦福大学CS25上讲了一堂“LLM推理”课。
Cursor突然断供,码农AI Coding就像被砍掉了手脚!如今,清华系最强平替MonkeyCode站在了C位,不仅性能炸裂、成本超低,还能应对复杂编程任务,首发支持Kimi K2和Qwen3。
今天带来 Myshell ShellAgent 2.0 的测试和介绍。 发现 Myshell 上了一个 ShellAgent 2.0 的能力,只需要提示词就能生成一个 Agent 应用。他们这个有意思的点是,没有复杂的前端页面都会在一个 Chatbot 里构建类似的交互,这就摆脱了构建前端的复杂流程降低了错误率,Agent 只需要管理工具之间的交互就可以。
你有没有想过,为什么那些看起来无所不能的 AI agent,在真实工作环境中却总是显得如此笨拙?我们花费数百小时调试提示词、完善指令,但这些智能系统依然无法像人类员工那样从经验中学习和成长。它们不会从错误中汲取教训,也不会在重复性任务中变得更加熟练。这个根本性问题,正是 Composio 刚刚完成 2500 万美元 A 轮融资要解决的核心挑战。
硅谷 AI 投资人 Elad Gil 昨天发布了自己对 AI 领域投资的总结回顾与预测。在他看来,过去四年 AI 经历了从 “技术迷雾”到“商业马拉松” 的变化:随着模型能力的不断提升,过去 12 个月里一系列 AI 应用落地的细分场景在得到验证,头部公司浮现,一定程度上,未来 1-2 年的市场格局初定,AI 应用层正进入收敛周期:
就在昨天,来自UCLA的两位研究者黄溢辰和杨林做了一件让整个AI圈都震惊的事。他们用Google的Gemini 2.5 Pro模型,在2025年国际数学奥林匹克竞赛中拿下了金牌水平的成绩,6道题解对了5道。这可不是什么花架子,IMO被公认为是测试AI推理能力的终极试金石,因为它需要的不仅仅是计算,更需要创造性思维和严密的逻辑推理。
故意为之 当地时间周三(7月23日),美国总统特朗普在华盛顿特区举行的人工智能峰会上发言。
复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。
一位从业20年设计师的自白。7月的杭州,潮湿的空气似乎随时都在酝酿一场暴雨。