
传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?
传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?高质量数据枯竭,传统预训练走向终点,大模型如何突破瓶颈?
高质量数据枯竭,传统预训练走向终点,大模型如何突破瓶颈?
Llama 4被曝在大模型竞技场作弊后,重新上架了非特供版模型。但是你很可能没发现它。因为排名一下子从第2掉到了第32,要往下翻好久才能看到。
昨天,是国产 AI 六小虎之一百川智能成立的两周年,CEO 王小川发布全员信强调公司方向: “ 减少多余动作,专注医学方向。”要知道,两年前,百川智能刚成立的时候,其愿景可是 “ 旨在打造中国版的 OpenAI 基础大模型及颠覆性上层应用 ”,非常宏大。
蚂蚁集团副总裁、前百灵大模型一号位徐鹏(花名:无改),已于近日离职;此外,据「市象」了解,基于蚂蚁百灵大模型的AI应用支小宝团队也在近期面临团队人员调整。
随着技术的深入应用,如何高效利用大模型技术优化用户体验,同时应对其带来的诸多挑战?本文将从RAG的发展趋势、技术挑战、核心举措以及未来展望四个维度总结我们应对挑战的新的思路和方法。
在 Gemini 的爆火之后,Google Cloud 正在成为真正意义上的「基础设施」。
当下,中国医疗行业正迎来一场硬核突围的历史性转折。面对供应链断裂、技术垄断多重封锁,国产医疗三剑客以技术为剑,以创新为盾,强势打破技术护城河。这将是一场从「跟跑」到「领跑」的逆袭之战。
又一专业领域成功引入AI工程师!
在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。
港中文、清华等高校提出SICOG框架,通过预训练、推理优化和后训练协同,引入自生成数据闭环和结构化感知推理机制,实现模型自我进化,为大模型发展提供新思路。