
Lumina-mGPT 2.0:自回归模型华丽复兴,媲美顶尖扩散模型
Lumina-mGPT 2.0:自回归模型华丽复兴,媲美顶尖扩散模型上海人工智能实验室等团队提出Lumina-mGPT 2.0 —— 一款独立的、仅使用解码器的自回归模型,统一了包括文生图、图像对生成、主体驱动生成、多轮图像编辑、可控生成和密集预测在内的广泛任务。
上海人工智能实验室等团队提出Lumina-mGPT 2.0 —— 一款独立的、仅使用解码器的自回归模型,统一了包括文生图、图像对生成、主体驱动生成、多轮图像编辑、可控生成和密集预测在内的广泛任务。
今年的世界人工智能大会(WAIC)可谓热闹非凡,据说有的展台甚至一度拥挤到工作人员都难以进入。 在出圈的众多机器人和终端产品之外,另一个领域也值得我们关注:科学智能(AI for Science,AI4S)。
过去因为技术门槛而止步的需求,开始通过 AI 变成现实。
字节跳动在 Trae IDE(Visual Studio Code 的分支)中发现的令人担忧的性能和隐私问题。主要发现包括:资源消耗过高(33 个进程 vs. VSCode 中为 9 个进程)、无论用户如何设置,遥测数据都会持续传输,以及令人担忧的社区管理实践。
在AI时代,掌握编程语言成了科研人的「第二外语」?近日,WAIC 2025上,上海科学智能研究院、复旦大学、无限光年联合发布「星河启智科学智能开放平台」,让科学家轻松构建AI模型、发起实验、调度算力,真正成为探索的主角。
7 月 26 日,字节将 AI Agent 平台「扣子(Coze)」旗下最核心的两个项目—— Coze Studio 与 Coze Loop 正式开源至 GitHub,并采用开放程度更高、可自由用于任何商业用途的 Apache 2.0 许可证,无任何附加条款。开源仅两天,项目已在 GitHub 上收获超过 6K star。
从 OpenAI、字节跳动,到一众创业团队,今年几乎所有 AI 公司都在推进自己的 Agent 战略:有人做工具执行器,有人做工作流代理,有人主打插件调度,有人想做全能副驾……
AI语音成大厂必争之地 打开字节、阿里们的多模态能力地图,每块宝藏都标着"语音”。
国内 AI 创企 RockAI 提出的非 Transformer 架构 Yan 2.0 Preview。这个架构极大地降低了模型推理时的计算复杂度,因此可以在算力非常有限的设备上离线运行,比如树莓派。
ShellAgent 2.0, 没有选择卷复杂华丽的前端页面,而是闷头把后台交互卷到极致。 也就是说,我们写生成应用提示语的难度降到了有嘴就会的级别。