不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件
不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件没有训练梯度的AI,打破了Atari游戏满分纪录。OpenAI核心研究员翁家翌提出了一个强化学习新范式——启发式学习(Heuristic Learning, HL)。
搜索
没有训练梯度的AI,打破了Atari游戏满分纪录。OpenAI核心研究员翁家翌提出了一个强化学习新范式——启发式学习(Heuristic Learning, HL)。
Epoch AI最新数据:Anthropic人均年营收900万美元,远超OpenAI的560万和英伟达的510万。一家没上市的AI公司,人效已刷新硅谷全部历史纪录。
如果你这周自己写了求职信,你输给的并不是更好的候选人。你输给了一个更差的候选人,他花了 20 美元给 OpenAI。 今年初,马里兰大学、新加坡国立大学和俄亥俄州立大学的三位研究者从 LiveCare
这场Musk v. 奥特曼审判,正在把OpenAI最不想公开的内部裂痕一次性摊开:前CTO Mira Murati作证称奥特曼曾在模型安全审批上误导她,还长期制造高管间的「混乱与不信任」。核心看点不只是八卦,而是OpenAI到底是怎样从「非营利理想」一步步走到今天的权力与利益之争,这会直接影响外界对OpenAI、治理、AI安全和公司合法性的判断。
就在今天,OpenAI 的 Codex 团队开发者体验工程师 Jason Liu 发推公布了一个「小而有爱」的项目:OpenAI 官方推出了命令行界面工具 openai-cli,开发者只需在终端敲下一行命令,即可直接与 OpenAI 的最新模型深度交互,打破了过去SDK的限制。
其中,大家「讨伐」声量最大的莫过于 ChatGPT 了,从 AI 味儿熏人的经典破折号、「不是 A,而是 B」句式,以及前段时间间歇性出现的「哥布林」,再到如今充满青春伤痛文学矫情劲儿的「我会稳稳接住你」,用户快要被折磨疯了:我们关系可以亲密,但没必要这么亲密。
18岁高中生挖出约150万个未知天体,25岁博士生给1.4亿张星系图装上自然语言搜索……OpenAI发布了首届「ChatGPT Futures Class of 2026」,26位入选者来自从大一就用上ChatGPT的年轻群体,他们正在用AI改写「优秀年轻人」的定义。
不知道大家平时有没有这种经历。
Anthropic 在短短几年内就成为了OpenAI 的最强劲敌!
1.2万亿美元!Anthropic 估值正式反超OpenAI,硅谷局势彻底变了!手握马斯克的22万张顶级GPU,以及谷歌2000亿美元的长约,这场万亿美金级别的史诗级豪赌,正带我们见证硅谷商业史上最疯狂的「王位更替」。