北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略
北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。
在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。
多模态大语言模型(MLLMs)已成为AI视觉理解的核心引擎,但其在真实世界视觉退化(模糊、噪声、遮挡等)下的性能崩溃,始终是制约产业落地的致命瓶颈。
你是否曾被AI视频生成的不连贯性所困扰?
昨天看到 MiniMax 的上市招股书,一些往事涌上心头。 2024 年 4 月 1 日,我从工作了 500 天的 MiniMax 离职,也彻底终结了自己 15 年的产品经理生涯。 MiniMax 是我加入的第四家上市公司,也曾是我最喜欢的一家公司。
在全球资本市场对人工智能基础设施持续加码、而IPO窗口尚未完全恢复的背景下,Databricks选择继续通过私募市场扩充资本实力。 这家企业级数据智能公司近日完成了一轮规模达40亿美元的L轮融资,投后估值达到1340亿美元,较三个月前的1000亿美元估值上涨34%。
人工智能初创公司Resolve AI 近日完成 A 轮融资,由 Lightspeed Venture Partners 领投。该公司致力于开发自动化站点可靠性工程师工具,能够自主维护软件系统运行。
用 AI,把百万级的鹰眼系统打造「万元级」的平民运动生意。
2025年,某社交平台上一篇帖子火了。一位网友贴出打码贴出录用意向书,略带调侃地宣布:“达成靠AI挂面率为零的新成就。”
如何回顾2025年的AI进展?
目前,传统广电行业正面临一场深刻的生存危机。外部竞争压力持续加剧,不断挤压行业原有的发展空间:家庭智能语音设备渗透率已经突破 68%,短视频平台日均占用用户时长已经高达 2.8 小时,用户注意力的结构性转移趋势已然形成。