AI资讯新闻榜单内容搜索-ai

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ai
只要强化学习1/10成本!翁荔的Thinking Machines盯上了Qwen的黑科技

只要强化学习1/10成本!翁荔的Thinking Machines盯上了Qwen的黑科技

只要强化学习1/10成本!翁荔的Thinking Machines盯上了Qwen的黑科技

今天要讲的On-Policy Distillation(同策略/在线策略蒸馏)。这是一个Thinking Machines整的新活,这个新策略既有强化学习等在线策略方法的相关性和可靠性;又具备离线策略(Off-policy)方法的数据效率。

来自主题: AI资讯
8296 点击    2025-10-29 11:12
AI产品的邀请码「黑市」,谁在制造稀缺?

AI产品的邀请码「黑市」,谁在制造稀缺?

AI产品的邀请码「黑市」,谁在制造稀缺?

火爆只是表象,邀请码没这么厉害。

来自主题: AI资讯
7005 点击    2025-10-29 11:00
别急着让豆包们上链接

别急着让豆包们上链接

别急着让豆包们上链接

AI 带货,高级版摇一摇广告。

来自主题: AI资讯
4817 点击    2025-10-29 10:55
世界模型==VQA?机器人不用想象画面,预测语义就够了

世界模型==VQA?机器人不用想象画面,预测语义就够了

世界模型==VQA?机器人不用想象画面,预测语义就够了

对于机器人来说,世界模型真的有必要想象出精确的未来画面吗?在一篇新论文中,来自华盛顿大学、索尼 AI 的研究者提出了这个疑问。

来自主题: AI技术研报
5845 点击    2025-10-29 10:44
九方智擎亮相WTCC模速路演日:深化数字金融建设,打造有温度的AI投顾伙伴

九方智擎亮相WTCC模速路演日:深化数字金融建设,打造有温度的AI投顾伙伴

九方智擎亮相WTCC模速路演日:深化数字金融建设,打造有温度的AI投顾伙伴

2025西岸国际科技消费嘉年华(WTCC)模速路演日,九方智投控股旗下科技公司九方智擎作为金融科技代表亮相,分享AI+投顾从工具到“有温度的投资伙伴”的产业升级。

来自主题: AI资讯
8125 点击    2025-10-29 10:29
3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

今天推荐一个 Dense Image Captioning 的最新技术 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功将 DeepSeek-R1 的强化学习方法应用到 image captioning 这种开放视觉任务,创新的以实用性重新定义 image captioning 的 reward。

来自主题: AI技术研报
9109 点击    2025-10-29 10:24
仅需10%思维链标注,等同全量性能!计算所发布推理监督新范式

仅需10%思维链标注,等同全量性能!计算所发布推理监督新范式

仅需10%思维链标注,等同全量性能!计算所发布推理监督新范式

大语言模型(LLMs)推理能力近年来快速提升,但传统方法依赖大量昂贵的人工标注思维链。中国科学院计算所团队提出新框架PARO,通过让模型学习固定推理模式自动生成思维链,只需大模型标注1/10数据就能达到全量人工标注的性能。这种方法特别适合像金融、审计这样规则清晰的领域,为高效推理监督提供了全新思路。

来自主题: AI技术研报
5656 点击    2025-10-29 10:15
用「进化+压力测试」自动生成的竞赛级编程题,各家大模型谁更hold住?

用「进化+压力测试」自动生成的竞赛级编程题,各家大模型谁更hold住?

用「进化+压力测试」自动生成的竞赛级编程题,各家大模型谁更hold住?

在当前评测生成式模型代码能力的浪潮中,传统依赖人工编写的算法基准测试集,正日益暴露出可扩展性不足与数据污染严重两大瓶颈。

来自主题: AI技术研报
6946 点击    2025-10-29 10:03