
突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR
突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPRDeepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward
Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward
中东国家凭借雄厚石油财富积极投入AI领域,建设全球级数据中心,利用低电价和丰富光伏资源解决能耗问题。通过免税、居留便利等政策吸引全球创业者和资本。其地缘优势成为中美技术博弈的缓冲带,美国解除芯片限制,争抢中东市场和投资。海湾国家正转型为新兴AI中心。
恭喜 Meta。
今天,一家外媒曝出猛料:美国本来要搞「AI马歇尔计划」,但特朗普政府太无能像在摆烂,导致芯片不够、盟友跑光,「AI版北约」直接流产,CEO们急到头上冒烟。一场关乎芯片、就业、地缘政治的AI冷战,已经在悄然升级。其实这不仅仅关乎美国,你我都在牌桌上。
AI大牛何恺明最新动向来了!
无需原作者同意,AI可以用已出版书籍作训练数据了。
近年来,随着人工智能从感知智能向决策智能演进,世界模型 (World Models)逐渐成为机器人领域的重要研究方向。世界模型旨在让智能体对环境进行建模并预测未来状态,从而实现更高效的规划与决策。
近年来,diffusion Transformers已经成为了现代视觉生成模型的主干网络。随着数据量和任务复杂度的进一步增加,diffusion Transformers的规模也在快速增长。然而在模型进一步扩大的过程中,如何调得较好的超参(如学习率)已经成为了一个巨大的问题,阻碍了大规模diffusion Transformers释放其全部的潜能。
总是“死记硬背”“知其然不知其所以然”?
第一作者孙秋实是香港大学计算与数据科学学院博士生,硕士毕业于新加坡国立大学数据科学系。