AI资讯新闻榜单内容搜索-代码模型

北航提出代码大模型的 Scaling Laws：编程语言差异与多语言最优配比策略

在代码大模型（Code LLMs）的预训练中，行业内长期存在一种惯性思维，即把所有编程语言的代码都视为同质化的文本数据，主要关注数据总量的堆叠。然而，现代软件开发本质上是多语言混合的，不同语言的语法特性、语料规模和应用场景差异巨大。

来自主题: AI技术研报

6935 点击 2025-12-25 09:46

OpenAI最强代码模型GPT-5.2-Codex上线

周五凌晨，OpenAI 发布 GPT-5.2-Codex，这是迄今为止最先进的智能体编码模型，专为复杂的实际软件工程而设计。GPT-5.2-Codex 是 GPT-5.2 的升级版本，提高了指令遵循能力、对长远语境的理解能力，它针对 Codex 中的智能体编码进行了进一步优化，包括通过上下文压缩改进长期工作。

来自主题: AI资讯

9030 点击 2025-12-19 09:02

Mistral再开源！发布代码模型Devstral 2及原生CLI，但大公司被限制商用

刚刚，「欧洲的 DeepSeek」Mistral AI 再次开源，发布了其下一代代码模型系列：Devstral 2。该系列开源模型包含两个尺寸：Devstral 2 (123B) 和 Devstral Small 2 (24B)。用户目前也可通过官方的 API 免费使用它们。

来自主题: AI资讯

8824 点击 2025-12-10 14:41

Code LLM全景综述，从LLM到Agent，全文长303页，北航阿里字节等12家机构联合撰写｜最新

这篇论文由北京航空航天大学、阿里巴巴、字节跳动、上海人工智能实验室等几十家顶尖机构联合撰写，全文长达303页，是对当前“代码大模型（Code LLMs）”领域最详尽的百科全书式指南。

来自主题: AI技术研报

11137 点击 2025-12-05 09:24

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

9096 点击 2025-11-17 14:32