AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
独家|美团公测AI社区“觅游”,打造人和AI的赛博生活

独家|美团公测AI社区“觅游”,打造人和AI的赛博生活

独家|美团公测AI社区“觅游”,打造人和AI的赛博生活

美团推出一个AI社区“觅游”。该社区由美团基础研发的AI创新产品团队打造,是面向所有大模型和Agent产品的社区生态,也是美团所做的一次创新和激进的尝试。

来自主题: AI资讯
8953 点击    2026-05-08 10:39
大模型价格战背后,真正稀缺的不是Token

大模型价格战背后,真正稀缺的不是Token

大模型价格战背后,真正稀缺的不是Token

Anthropic在四月初发布Mythos,距离现在已经近一个月。行业内对于它的讨论,更多的关注点在于“它有多强”,但我更想聊聊它的“发布方式”。

来自主题: AI资讯
8813 点击    2026-05-08 09:53
136亿!中国大模型最大融资完成

136亿!中国大模型最大融资完成

136亿!中国大模型最大融资完成

据华峰资本消息,近日,北京AI大模型独角兽月之暗面(Kimi)完成新一轮约20亿美元(约合人民币136.22亿元)融资,为中国大模型圈目前最大额融资,投后估值突破200亿美元(约合人民币1362.25亿元)。

来自主题: AI资讯
9183 点击    2026-05-07 16:57
ICSE 2026杰出论文 | 突破代码模型真实工程落地瓶颈,北大团队提出SEAlign对齐框架:显著提升软件工程智能体决策质量

ICSE 2026杰出论文 | 突破代码模型真实工程落地瓶颈,北大团队提出SEAlign对齐框架:显著提升软件工程智能体决策质量

ICSE 2026杰出论文 | 突破代码模型真实工程落地瓶颈,北大团队提出SEAlign对齐框架:显著提升软件工程智能体决策质量

在代码大模型和代码智能体技术快速发展的今天,一个日益凸显的现象是:能够在经典代码生成基准上取得优异成绩的模型,一旦被放入真实软件工程环境中,表现却往往大幅下滑。

来自主题: AI技术研报
6108 点击    2026-05-07 15:02
GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们,或许都曾面临一个共同的困扰:当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型(SLMs)时,效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著,但一旦应用到 1.7B 甚至更小参数的模型上,性能提升就微乎其微。

来自主题: AI技术研报
8164 点击    2026-05-07 10:16
蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体

蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体

蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体

在对多位内部开发者的采访中得知,这个模型的研发已被叫停。LPM 1.0 并非仍在推进的核心项目,而是视频团队对过去一年工作成果的集中汇报——既是对外展示,也是对内总结。该视频团队由“童姥”( 前微软亚研院首席研究员童欣) 带领, AilingZeng做Tech Lead,作者中近半数来自 Anuttacon内部,蔡浩宇本人并未直接参与模型研发。

来自主题: AI资讯
8669 点击    2026-05-07 01:20
不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天

不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天

不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天

谷歌刚刚给Gemma 4家族更新了一项关键能力:Multi-Token Prediction(MTP)推测解码架构,推理速度最高提升3倍,输出质量不变。

来自主题: AI资讯
9094 点击    2026-05-06 14:56