
刚刚,北大&360里程碑式突破!32B安全分碾压千亿巨兽
刚刚,北大&360里程碑式突破!32B安全分碾压千亿巨兽打破思维惯性,「小模型」也能安全又强大!北大-360联合实验室发布TinyR1-32B模型,以仅20k数据的微调,实现了安全性能的里程碑式突破,并兼顾出色的推理与通用能力。
打破思维惯性,「小模型」也能安全又强大!北大-360联合实验室发布TinyR1-32B模型,以仅20k数据的微调,实现了安全性能的里程碑式突破,并兼顾出色的推理与通用能力。
采访时间不到1小时,信息密度却堪称爆炸! OpenAI首席科学家Jakub Pachocki和首席研究官Mark Chen开启同台爆料模式:氛围编码的下一步或许是氛围研究(Vibe Researching);
杜克大学团队发现,扩散大语言模型只需关注少量「中奖」token,就能在推理时把速度提升61-97倍,还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息,实现「少算多准」的双赢。
这年头出门逛展,中国厂商真的是把排面拉爆了。比如火热进行中的东京电玩展(TGS),现场是这样的:一眼AI含量爆棚的,当属阿里展台——通义千问和通义万相两个开源界当红炸子鸡,妥妥C位出展。
在大模型训练时,如何管理权重、避免数值爆炸与丢失?Thinking Machines Lab 的新研究「模块流形」提出了一种新范式,它将传统「救火式」的数值修正,转变为「预防式」的约束优化,为更好地训练大模型提供了全新思路。
上周,一个做算法的朋友给我演示了用大模型生成电路原理图的过程。那个瞬间,我仿佛看到了未来的轮廓——当AI开始理解硬件设计,我们这些靠经验在竞争中胜出的工程师,出路在哪里?
奥特曼投下震撼弹:五年后AI将全面超越人类,到2030年诞生的「超级智能」甚至能攻克「量子引力」难题。人类智力的霸权时代,已进入倒计时。他在接受德国《世界报》采访时表示:我可以肯定地说,到2030年底之前,如果我们没能开发出能够完成人类自身无法企及任务的超级智能模型,我会感到非常意外。
业界首个高质量原生3D组件生成模型来了!来自腾讯混元3D团队。现有的3D生成算法通常会生成一体化的3D模型,而下游应用通常需要语义可分解的3D形状,即3D物体的每一个组件需要单独地生成出来。
超越DeepMind的Langfun、抱抱脸的Smolagent等,国产智能体位列全球智能体第一梯队!GitHub明星开源项目、行业首个100%开源的企业级智能体JoyAgent,迎来重要更新——
云栖大会上,阿里宣布AI平台将把完整的英伟达Physical AI(物理AI)软件栈纳入其开发者选项菜单。这个看似技术性的宣布,实际上标志着人工智能发展的一个重要转折点。英伟达CEO黄仁勋在2025年CES大会上明确表示:AI下一个前沿就是物理AI,蕴藏着巨大的潜力和机遇。