
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法》。
GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法》。
大自然的分形之美,蕴藏着宇宙的设计规则。刚刚,何恺明团队祭出「分形生成模型」,首次实现高分辨率逐像素建模,让计算效率飙升4000倍,开辟AI图像生成新范式。
何恺明再次开宗立派!开辟了生成模型的全新范式——
据 The Information 报道,Field AI 是一家成立两年的初创公司,专注于开发人工智能模型以驱动机器人,正在洽谈以 20 亿美元的估值筹集数亿美元资金。这将使该初创公司的估值比去年夏天翻四倍,当时包括 Nvidia 在内的投资者将其估值为 5 亿美元。
2月19日晚间,据科技媒体The Information报道,DeepSeek正在考虑首次外部融资。知情人士透露,DeepSeek内部已经开始讨论是否接受外部融资,以获取更多的AI芯片和服务器资源。
游戏开发不仅需要生成新颖的内容,更需要在保持游戏世界一致性、多样性和用户修改持续性方面达到高度平衡。近日,一篇发表在Nature上的研究论文World and Human Action Models towards Gameplay Ideation揭示了如何利用生成式AI模型推动游戏玩法创意的生成。
OpenAI前CTO Murati离职后,终于官宣新动向!她创立的「思考机器实验室」汇聚了OpenAI、谷歌DeepMind等顶尖AI人才,包括OpenAI联合创始人Schulman、前安全副总Lilian Weng等。
在当下的技术领域中,人像视频生成(Human-Video-Animation)作为一个备受瞩目的研究方向,正不断取得新的进展。人像视频生成 (Human-Video-Animation) 是指从某人物的视频中获取肢体动作和面部表情序列,来驱动其他人物个体的参考图像来生成视频。
先是三星宣布智谱的Agentic GLM成为其新手机Galaxy S25的AI能力来源,紧接着The Information爆料,在经历了近一年的模型测试与合作伙伴探索后,苹果终于敲定了中国市场的合作伙伴:阿里巴巴。这意味着,中国iPhone用户很可能在今年迎来一个由国产大模型驱动的iPhone。
DreamTech,由牛津大学、南京大学等顶尖高校研究者组成的AI创业团队,在春节期间公布了他们在3D生成方向上的新工作成果——Neural4D 2.0(初版名为Direct3D),提出了创新性的3D Assembly Generation算法思路及更高效的模型架构