让大模型不再过度思考!上海AI Lab后训练新范式重塑CoT,推理又快又好
让大模型不再过度思考!上海AI Lab后训练新范式重塑CoT,推理又快又好近日,上海人工智能实验室的研究团队提出了一种全新的后训练范式——RePro(Rectifying Process-level Reward)。这篇论文将推理的过程视为模型内部状态的优化过程,从而对如何重塑大模型的CoT提供了一个全新视角:
近日,上海人工智能实验室的研究团队提出了一种全新的后训练范式——RePro(Rectifying Process-level Reward)。这篇论文将推理的过程视为模型内部状态的优化过程,从而对如何重塑大模型的CoT提供了一个全新视角:
现有视频生成模型往往难以兼顾「运镜」与「摄影美学」的精确控制。为此,华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室团队推出了 CineCtrl。作为首个统一的视频摄影控制 V2V 框架,CineCtrl 通过解耦交叉注意力机制,摆脱了多控制信号共同控制的效果耦合问题,实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制。
OpenAI又双叒要融资了!据知情人士透露,OpenAI正在与亚马逊等投资者接触,计划筹集1000亿美元资金。 如果能够筹得目标金额,OpenAI的投后估值可能升至约8300亿美元。
庞若鸣被扎克伯格天价挖去Meta后,谁在执掌苹果大模型团队?团队的权力交接,其实比外界想象中要快,也要安静得多。答案很快浮出水面。接手这支团队的人,是庞若鸣的老搭档:Zhifeng Chen。
他独自承担了一个复杂的 TypeScript 微服务项目的改造工作。为了让老板同意,他当场拍着胸脯保证六个月内完成。随后,他转身将 Claude Code 调教成得力助手,协助自己管理与重写工作。为此,他每月花费 200 美元(约 1422 元)开通 Max 20x 套餐,将原本约 10 万行的项目重构为 30~40 万行规模。
起猛了,怎么在演唱会看到人形机器人跳「韦伯斯特」了! 真就一个大写的「Wow」!12 月 18 日,在王力宏「最好的地方」巡回演唱会成都站现场,六台人形机器人随《火力全开》歌曲登台与歌手及舞者同台表演。
最近各种年度回顾陆续上线, OpenAI 的前联合创始人 Andrej Karpathy 也交出了自己对大模型的年度总结。就在今年早些时候,他在 YC 的一场演讲刷爆了全网,提出了不少新的观点:
最近两天,一款名为《青椒模拟器》的小游戏突然火了,好玩程度一整个把人震撼住了。游戏时间以学年为单位推进。一开始,每个人的起点都差不多:职称未定、资源有限、热情尚存,他们会招募团队新成员、申请项目、处理学生遇到的问题、中间还会有各种各样的事务来让你选择,你的每个决定都会影响着之后的评级。
“全球大模型第一股”,在港交所发起冲刺了。被视为“中国版OpenAI”的智谱AI,刚刚招股书对外公告,冲刺IPO。智谱AI以秘密递表的形式,刚刚在港交所通过聆讯,即将敲钟。
AI不应是巨头游戏,模型也不是越大越聪明。近日,「Transformer八子」中的Ashish Vaswani和Parmar共同推出了一个8B的开源小模型,剑指Scaling Law软肋,为轻量化、开放式AI探索了新方向。