陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能新年刚至,陈天桥携手代季峰率先打响开源大模型的第一枪。
新年刚至,陈天桥携手代季峰率先打响开源大模型的第一枪。
凭借成功预测 Polymarket 题目,连续登顶 Future X 全球榜首的 MiroMind 团队,于今日(1 月 5 日)正式发布其自研旗舰搜索智能体模型 MiroThinker 1.5。MiroThinker-v1.5-30B 仅用 1/30 的参数规模跑出了比肩众多 1T 模型的性能表现,其 235B 的版本在多个搜索智能体基准测试中跻身全球第一梯队。
去年花 3000 万美元都买不到的团队,今年字节跳动自己做了个类似的产品,还限时免费。刚刚,字节在海外悄悄上线了 AnyGen,功能看起来和当年想收购的 Manus 有点像——都是语音驱动的 AI 工作空间,能把你的语音、照片、想法直接变成文档、PPT、甚至故事书。
在近一年里,Agentic System(代理系统/智能体系统)正变得无处不在。从Open AI的Deep Research到Claude Code,我们看到越来越多的系统不再依赖单一模型,而是通过多模型协作来完成复杂的长窗口任务。
一家名为 Qveris AI 的初创公司,聚焦于 Agent 时代的 Infra 层,正致力于为 Agent 设计原生搜索和行动路由引擎。据悉,截至目前该公司已获得近千万元种子轮融资。如果说具身智能是为 AI 安上了与现实世界交互的“身体”,那么 Qveris AI 正在做的事就是给智能体(Agent)装上了数字世界的“眼、耳、手、脚”。
AI手机的“灵魂”GUI智能体,就这么全套开源了。
在大模型智能体(LLM Agent)落地过程中,复杂工作流的高效执行、资源冲突、跨框架兼容、分布式部署等问题一直困扰着开发者。而一款名为Maze的分布式智能体工作流框架,正以任务级精细化管理、智能资源调度、多场景部署支持等核心优势,为这些痛点提供一站式解决方案。
今天凌晨收到 Manus 联合创始人的微信:「鹏哥,我们今天有个新进展,之前确实不好透露太多。现在正式发布了,我第一时间给你说一声。」
做agent简单,但是做能落地的agent难,做能落地的长周期agent更是难上加难!
近年来,大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时,传统的链式思维(Chain-of-Thought)往往就开始「吃力」:容易被早期判断带偏、发散不足、自我纠错弱,而且顺序生成的效率天然受限。