AI资讯新闻榜单内容搜索-算法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 算法
SimKO:缓解RLVR训练中的概率过度集中,优化pass@K性能

SimKO:缓解RLVR训练中的概率过度集中,优化pass@K性能

SimKO:缓解RLVR训练中的概率过度集中,优化pass@K性能

研究团队提出一种简洁且高效的算法 ——SimKO (Simple Pass@K Optimization),显著优化了 pass@K(K=1 及 K>1)性能。同时,团队认为当前的用熵(Entropy)作为指标衡量多样性存在局限:熵无法具体反映概率分布的形态。如图 2(c)所示,两个具有相同熵值的分布,一个可能包含多个峰值,而另一个则可能高度集中于一个峰值。

来自主题: AI技术研报
6871 点击    2025-11-08 15:48
只用国产GPU训练的大模型性能飙升100%!国内唯一,更懂你

只用国产GPU训练的大模型性能飙升100%!国内唯一,更懂你

只用国产GPU训练的大模型性能飙升100%!国内唯一,更懂你

刚刚,唯一全国产算力训出的大模型重磅升级,推理效率飙升100%,数学能力国际领先。当全球巨头还在云端「卷」算法时,中国队则亮出了软硬一体这一截然不同的底牌。

来自主题: AI资讯
8790 点击    2025-11-07 10:14
清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

近期,Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5,其核心亮点之一便是被称为 Motion Transfer Mechanism(MT)的端到端动作迁移算法 —— 无需重新训练,即可把不同形态机器人的技能「搬」到自己身上。不过,官方技术报告对此仅一笔带过,细节成谜。

来自主题: AI技术研报
8271 点击    2025-11-05 16:39
产品还是个文件夹,投资人抢着砸钱:只因她是「前OpenAI」?

产品还是个文件夹,投资人抢着砸钱:只因她是「前OpenAI」?

产品还是个文件夹,投资人抢着砸钱:只因她是「前OpenAI」?

十年前,「黑手党」这个词还属于PayPal。十年后,它成了OpenAI。那些离开OpenAI的人,没有远去,而是在外部重建另一个OpenAI。他们互相投资、互相背书,从算法到资本,织出一张无形的权力网。AI的故事,看似在讲技术,其实是在讲权力的继承。当算法学会模仿人类,人类也在用算法,复制自己的帝国。

来自主题: AI资讯
5869 点击    2025-11-05 11:01
NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能。

来自主题: AI技术研报
6125 点击    2025-11-04 11:33
给大模型版权上“防盗锁”!浙大新方法既能装指纹又能防篡改

给大模型版权上“防盗锁”!浙大新方法既能装指纹又能防篡改

给大模型版权上“防盗锁”!浙大新方法既能装指纹又能防篡改

随着 AI 技术的发展,大语言模型已经越来越多地应用于人们的日常生活中。需要了解的是,现阶段大语言模型面临版权保护的实际需求:

来自主题: AI技术研报
8934 点击    2025-11-03 14:19
ICU昏迷不醒,AI判决生死!取意愿平均值,细思极恐

ICU昏迷不醒,AI判决生死!取意愿平均值,细思极恐

ICU昏迷不醒,AI判决生死!取意愿平均值,细思极恐

当医生按下Enter键,AI就能决定人的生死!美国华盛顿大学,一项名为「AI代理人」的研究,试图让算法预测昏迷患者的生死意愿。支持者说这是医疗新纪元,反对者担心它只是复制偏见的机器。当AI学会理解生命,人类的怜悯、犹豫与责任,会不会被一串数据取代?

来自主题: AI资讯
8547 点击    2025-11-02 10:47
港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」

港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」

港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」

论文第一作者何浩然是香港科技大学博士生,研究方向包括强化学习和基础模型等,研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计

来自主题: AI技术研报
8323 点击    2025-11-01 09:24
陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战

陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战

陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战

今天,谷歌DeepMind重磅发起「AI赋能数学计划」,集结了全球五大顶尖机构。他们将用上谷歌最强数学AI,去探索发现新的疆域。这其中,有夺下IMO金牌的Gemini Deep Think,有算法发现AI智能体AlphaEvolve,还有形式化证明自动补全AlphaProof。

来自主题: AI资讯
6460 点击    2025-10-31 14:58