美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?
美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型,拥有 5600 亿个参数,基于创新的 MoE 架构构建。该模型引入了强大的重思考模式(Heavy Thinking Mode),能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前重思考模式已在 LongCat AI 平台正式上线,人人均可体验。
美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型,拥有 5600 亿个参数,基于创新的 MoE 架构构建。该模型引入了强大的重思考模式(Heavy Thinking Mode),能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前重思考模式已在 LongCat AI 平台正式上线,人人均可体验。
随着AI大模型研发在架构、记忆、存储等等领域的深水区创新,OCR重新成为了技术专项。DeepSeek在研究、智谱在研究、阿里千问和腾讯混元也都在研究……还得是吴恩达老师,火速来了新课程,帮你速通OCR。
今天我们来聊聊:480 万人看过的 Claude Code 方法论。这篇文章的作者叫 Eyad。从履历看,是典型的技术老兵:在 Amazon、Disney、Capital One 这样的巨头公司做过 7 年工程,参与过面向百万级用户的系统开发。现在,他是初创公司 Varickai 的 CTO。
唯“快”不破的美团闪购,这次搞了一波AIGC技术流营销。先说结论,从已经公开的视频来看,他们算是终于回答了一个近几年被反复提起、却很少被真正解决的问题——在当下这个时代,品牌方到底该怎么用AIGC。
本次发布的核心——AIMesh,正是这场架构创新的集大成者。 它被定义为面向「AI工厂」的数据与内存网,核心思路是用一套「三网合一」的柔性网络,替代传统僵化的存储架构。
项目缘起:从 0 到 1 的 PromptTuner 诞生之路 随着大模型技术的普及,AI 交互已成为日常工作的重要组成部分。然而,如何写出高质量的提示词(Prompt)却成为普通用户面临的新挑战。
MemGovern团队 投稿 量子位 | 公众号 QbitAI 人类程序员碰到棘手bug通常会上网查询前辈经验。 当前AI虽然开始具备联网搜索能力,但仍不能很好地从网络经验中获取修复bug的能力。 让
近日,德国物理学家、百万粉丝科普博主Sabine Hossenfelder在一则视频中,抛出了一个让学术界「脊背发凉」的观点:三年内,我们所熟悉的科学研究将不复存在。但AI能力的进化速度,远远超出人类预期。
近期,来自墨尔本大学和华中科技大学的研究者们发布了一篇深度综述,从 MLSys 的思维出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化方法进行了系统性梳理与深入分析,并将相关资源整理成了持续维护的 Awesome 资源库,方便研究者与从业人员快速定位与落地。
Claude Cowork一出,直接砸碎了Guohao Li的创业梦,华人学者反手把分布式多智能体项目全开源!代码朋克的怒火,已点燃整个AI社区。下一代Agent的战争,就此打响。
数学奇点初现!Gemini攻克全新数学定理,斯坦福大牛惊呼「想出来能吹一辈子」;陶哲轩预言数学家+AI共生未来;Grok发现黎曼猜想新的隐蔽通道……
2026年真正爆点,必将是「超级组织」崛起。AI开始进入团队重写工作流,自动执行共享记忆,与团队协同让效率原地起飞。你的下一位同事,可能是AI。
昨晚,超级超级开心的邀请了我的两位好朋友、也是我的两位偶像海辛和阿文,来我的视频号做了一场直播。
o1从榜首暴跌至#56,Claude 3 Opus坠入#139。LMSYS榜单揭示残酷真相:大模型的「霸主保质期」只有35天!这不是技术迭代,这是对所有应用层开发者的降维屠杀。
这是一个拥有23.7k star的Skills开源项目。支持一键部署在Claude code、Codex以及最近非常火的Opencode。
“卡买回来了,然后呢?”
大语言模型(LLMs)的爆发式增长引领了人工智能领域的范式转移,取得了巨大的工程成功。然而,一个关键的悖论依然存在:尽管 LLMs 在实践中表现卓越,但其理论研究仍处于起步阶段,导致这些系统在很大程度上被视为难以捉摸的「黑盒」。
谷歌Veo 3.1又双叒升级了!
2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。
Hinton百万引用的背后,是数篇奠基「现代人工智能」的不朽之作!
胡宇航(网名 “U 航”),毕业于美国哥伦比亚大学,博士学位,首形科技创始人。长期专注于机器人自主学习的研究工作。研究成果发表于《Nature Machine Intelligence》,《Science Robotics》等国际顶级期刊。
巨头们围绕AI的人才争夺战,现在不止于计算机领域了。
机器学习部署在边端设备的时候,模型总是存储在云端服务器上(5G 基站),而模型输入输出总是在边端设备上(例如用照相机拍摄照片然后识别其中的目标)。在这种场景下,传统有以下两种方案完成机器学习的推理:
新年第一天,DeepSeek 发布了一篇艰深晦涩的技术论文,不少网友直呼「看不懂」。
在 Claude 推出 Cowork 功能后,一个明显的信号 —— Agent 不仅仅是辅助工具,而是一种可以被设计、被组织、被反复调用的协作单元。
今天,OpenAI在ChatGPT网页端悄悄推出了独立的翻译功能——ChatGPT Translate。乍一看,它与谷歌翻译等传统翻译工具颇为类似。真正将二者区分开来的,可能是翻译后ChatGPT Translate提供的交互与个性化调整能力。
谷歌正式发布了由最新Gemini3模型驱动的“Personal Intelligence”功能。它将谷歌旗下四大应用的数据池进行了底层连接,让AI获得了跨应用权限。
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。结果?300万行代码。数千个文件。
1 月 15 日上午,千问又前进了一大步,已经准备让智能体全面接管我们的日常生活了。千问 App 上线了全新 AI Agent 能力「任务助理」,同时全面打通阿里生态,一次开启了 400 多项新功能,邀请测试与灰度上线已经同步开启,全都是免费可用的。
据《智能涌现》独家获悉,Noumena近期获得数千万人民币Pre-A轮融资,投资方包括狮城资本、百度战投以及老股东靖亚资本。Noumena的三位联合创始人,Jett曾任小红书KA行业群总经理,另外两位联合创始人,均是历经第四范式商业与工业化历练的科学家