AI资讯新闻榜单内容搜索-代码模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 代码模型
北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。

来自主题: AI技术研报
6675 点击    2025-12-25 09:46
OpenAI最强代码模型GPT-5.2-Codex上线

OpenAI最强代码模型GPT-5.2-Codex上线

OpenAI最强代码模型GPT-5.2-Codex上线

周五凌晨,OpenAI 发布 GPT-5.2-Codex,这是迄今为止最先进的智能体编码模型,专为复杂的实际软件工程而设计。GPT-5.2-Codex 是 GPT-5.2 的升级版本,提高了指令遵循能力、对长远语境的理解能力,它针对 Codex 中的智能体编码进行了进一步优化,包括通过上下文压缩改进长期工作。

来自主题: AI资讯
8734 点击    2025-12-19 09:02
Mistral再开源!发布代码模型Devstral 2及原生CLI,但大公司被限制商用

Mistral再开源!发布代码模型Devstral 2及原生CLI,但大公司被限制商用

Mistral再开源!发布代码模型Devstral 2及原生CLI,但大公司被限制商用

刚刚,「欧洲的 DeepSeek」Mistral AI 再次开源,发布了其下一代代码模型系列:Devstral 2。该系列开源模型包含两个尺寸:Devstral 2 (123B) 和 Devstral Small 2 (24B)。用户目前也可通过官方的 API 免费使用它们。

来自主题: AI资讯
8572 点击    2025-12-10 14:41
Code LLM全景综述,从LLM到Agent,全文长303页,北航阿里字节等12家机构联合撰写|最新

Code LLM全景综述,从LLM到Agent,全文长303页,北航阿里字节等12家机构联合撰写|最新

Code LLM全景综述,从LLM到Agent,全文长303页,北航阿里字节等12家机构联合撰写|最新

这篇论文由北京航空航天大学、阿里巴巴、字节跳动、上海人工智能实验室等几十家顶尖机构联合撰写,全文长达303页,是对当前“代码大模型(Code LLMs)”领域最详尽的百科全书式指南。

来自主题: AI技术研报
10812 点击    2025-12-05 09:24
VinciCoder:多模态统一代码生成框架和视觉反馈强化学习,数据代码模型权重已开源

VinciCoder:多模态统一代码生成框架和视觉反馈强化学习,数据代码模型权重已开源

VinciCoder:多模态统一代码生成框架和视觉反馈强化学习,数据代码模型权重已开源

长期以来,多模态代码生成(Multimodal Code Generation)的训练严重依赖于特定任务的监督微调(SFT)。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功 ,但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力,阻碍了通用视觉代码智能(Generalized VIsioN Code Intelligence)的发展 。

来自主题: AI技术研报
8909 点击    2025-11-17 14:32
看图写代码,3毛钱开发一个网页!字节AI Coding新模型真卷麻了

看图写代码,3毛钱开发一个网页!字节AI Coding新模型真卷麻了

看图写代码,3毛钱开发一个网页!字节AI Coding新模型真卷麻了

编程模型最新卷王来了。就在今天,火山引擎推出了面向Agentic编程任务深度优化的全新代码模型Doubao-Seed-Code。价格,调用价格国内最低,火山引擎还配套推出9块9套餐,一杯咖啡钱,就能搞定各种摸鱼小游戏——比如办公室躲老板(doge)。

来自主题: AI资讯
9729 点击    2025-11-11 19:56
Nano Banana爆火之后,一个神秘的「胡萝卜」代码模型又上线了

Nano Banana爆火之后,一个神秘的「胡萝卜」代码模型又上线了

Nano Banana爆火之后,一个神秘的「胡萝卜」代码模型又上线了

以前,每当上线一个新模型,大家总要绞尽脑汁想个响亮又不撞车的名字。 不得不说,有时候名字起得太出彩,甚至能把模型本身给卷下去。别人还没搞懂它能干嘛,名字已经在朋友圈刷屏了。

来自主题: AI资讯
7031 点击    2025-09-06 12:59
Grok代码模型来了:限时免费用,速度超级快

Grok代码模型来了:限时免费用,速度超级快

Grok代码模型来了:限时免费用,速度超级快

速度比 GPT-5 快三倍,便宜六倍。 本周四,马斯克的 xAI 正式推出了旗下的最新代码模型 Grok Code Fast 1。

来自主题: AI资讯
8037 点击    2025-08-29 14:03
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿

Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿

Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿

昨天深夜,月之暗面发布了开源代码模型Kimi-Dev-72B。这个模型在软件工程任务基准测试SWE-bench Verified上取得了60.4%的成绩,创下开源模型新纪录,超越了包括DeepSeek在内的多个竞争对手。

来自主题: AI资讯
7157 点击    2025-06-18 11:20
Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源

Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源

Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源

深夜,沉寂已久的Kimi突然发布了新模型—— 开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。

来自主题: AI资讯
9676 点击    2025-06-17 11:34