
业界首个高质量原生3D组件生成模型来了!来自腾讯混元团队
业界首个高质量原生3D组件生成模型来了!来自腾讯混元团队业界首个高质量原生3D组件生成模型来了!来自腾讯混元3D团队。现有的3D生成算法通常会生成一体化的3D模型,而下游应用通常需要语义可分解的3D形状,即3D物体的每一个组件需要单独地生成出来。
业界首个高质量原生3D组件生成模型来了!来自腾讯混元3D团队。现有的3D生成算法通常会生成一体化的3D模型,而下游应用通常需要语义可分解的3D形状,即3D物体的每一个组件需要单独地生成出来。
超越DeepMind的Langfun、抱抱脸的Smolagent等,国产智能体位列全球智能体第一梯队!GitHub明星开源项目、行业首个100%开源的企业级智能体JoyAgent,迎来重要更新——
云栖大会上,阿里宣布AI平台将把完整的英伟达Physical AI(物理AI)软件栈纳入其开发者选项菜单。这个看似技术性的宣布,实际上标志着人工智能发展的一个重要转折点。英伟达CEO黄仁勋在2025年CES大会上明确表示:AI下一个前沿就是物理AI,蕴藏着巨大的潜力和机遇。
LightVLA 是一个旨在提升 VLA 推理效率且同时提升性能的视觉 token 剪枝框架。当前 VLA 模型在具身智能领域仍面临推理代价大而无法大规模部署的问题,然而大多数免训练剪枝框架依赖于中间注意力输出,并且会面临性能与效率的权衡问题。
视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。
在三维重建、NeRF 训练、视频生成等任务中,相机参数是不可或缺的先验信息。传统的 SfM/SLAM 方法(如 COLMAP)在静态场景下表现优异,但在存在人车运动、物体遮挡的动态场景中往往力不从心,并且依赖额外的运动掩码、深度或点云信息,使用门槛较高,而且效率低下。
AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑?解决方案来了——SEAL全新对比学习框架通过带结构感知+元素对齐,让模型更懂长文。
开源框架实现100%可复现的稳定RL训练!下图是基于Qwen3-8B进行的重复实验。两次运行,一条曲线,实现了结果的完美重合,为需要高精度复现的实验场景提供了可靠保障。这就是SGLang团队联合slime团队的最新开源成果。
2016年,Hinton曾建议停止培训放射科医生,因为他们在未来五年中很可能被AI取代。如今已快九年,美国放射科医生不仅没有被AI取代,而且还以52万美元的平均年薪成为全美第二高薪的医疗专业,岗位数量也创下历史新高。
OpenAI发布最新研究,却在里面夸了一波Claude。他们提出名为GDPval的新基准,用来衡量AI模型在真实世界具有经济价值的任务上的表现。具体来说,GDPval覆盖了对美国GDP贡献最大的9个行业中的44种职业,这些职业年均创收合计达3万亿美元。任务基于平均拥有14年经验的行业专家的代表性工作设计而成。