AI资讯新闻榜单内容搜索-Scaling

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Scaling

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

最近，关于大模型推理的测试时间扩展（Test time scaling law ）的探索不断涌现出新的范式，包括① 结构化搜索结（如 MCTS），② 过程奖励模型（Process Reward Model ）+ PPO，③ 可验证奖励（Verifiable Reward）+ GRPO（DeepSeek R1）。

来自主题: AI技术研报

7847 点击 2025-07-04 09:44

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

在我们去年 AI Scaling Laws article from late last year中，我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展，使得模型能力的增长速度超过了摩尔定律，并且单位 token 成本也相应地迅速降低。

来自主题: AI技术研报

7688 点击 2025-06-24 11:09

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

强化学习可以提升LLM推理吗？英伟达ProRL用超2000步训练配方给出了响亮的答案。仅15亿参数模型，媲美Deepseek-R1-7B，数学、代码等全面泛化。

来自主题: AI技术研报

7429 点击 2025-06-22 16:32

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

CVPR 2025，自动驾驶传来重大进展： Scaling Law，首次在这条赛道被验证！

来自主题: AI资讯

7106 点击 2025-06-17 10:35

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

不去今年的CVPR不知道，原来中国自动驾驶在AI领域的创新已经这么牛了。作为今年唯一受邀参与CVPR演讲的车企，这家公司在AI顶流圈层上桌吃饭了！

来自主题: AI资讯

9245 点击 2025-06-16 16:52

复旦大学/上海创智学院邱锡鹏：Context Scaling，通往AGI的下一幕

复旦大学/上海创智学院邱锡鹏：Context Scaling，通往AGI的下一幕

复旦大学/上海创智学院邱锡鹏：Context Scaling，通往AGI的下一幕

真正的智能在于理解任务的模糊与复杂，Context Scaling 是通向 AGI 的关键一步。

来自主题: AI技术研报

8955 点击 2025-06-15 15:45

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

7446 点击 2025-06-10 16:18

扩展强化学习：环境、奖励黑客、智能体、数据扩展

扩展强化学习：环境、奖励黑客、智能体、数据扩展

扩展强化学习：环境、奖励黑客、智能体、数据扩展

Test time scaling范式蓬勃发展。推理模型持续快速改进，变得更为高效且价格更为亲民。在评估现实世界软件工程任务（如 SWE-Bench）时，模型以更低的成本取得了更高的分数。以下是显示模型变得更便宜且更优秀的图表。

来自主题: AI技术研报

6376 点击 2025-06-09 10:25

英伟达揭示RL Scaling魔力！训练步数翻倍=推理能力质变，小模型突破推理极限

英伟达揭示RL Scaling魔力！训练步数翻倍=推理能力质变，小模型突破推理极限

英伟达揭示RL Scaling魔力！训练步数翻倍=推理能力质变，小模型突破推理极限

强化学习（RL）到底是语言模型能力进化的「发动机」，还是只是更努力地背题、换个方式答题？这个问题，学界争论已久：RL 真能让模型学会新的推理技能吗，还是只是提高了已有知识的调用效率？

来自主题: AI技术研报

7286 点击 2025-06-05 10:27

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

既能提升模型能力，又不显著增加内存和时间成本，LLM第三种Scaling Law被提出了。

来自主题: AI技术研报

7987 点击 2025-05-28 14:21

上一页当前第4页,共23页下一页