高保真、多控制集成于「统一画布」,组合式图像生成新范式!
高保真、多控制集成于「统一画布」,组合式图像生成新范式!Canvas-to-Image 是一种新型图像生成框架,将多种控制方式(如身份、姿态、空间布局)整合到一个统一画布中,用户可通过直观操作生成高保真、多控制的图像。它简化了创作流程,让用户在单一界面完成复杂创作,为AI创作工具提供了新范式。
Canvas-to-Image 是一种新型图像生成框架,将多种控制方式(如身份、姿态、空间布局)整合到一个统一画布中,用户可通过直观操作生成高保真、多控制的图像。它简化了创作流程,让用户在单一界面完成复杂创作,为AI创作工具提供了新范式。
不仅要抢好莱坞女演员的饭碗,AI 现在还要取代 P 站演员的工作。
近两年,随着底层大模型在 Coding 等方面上的能力提升,像秒哒这样的 AI 生产力产品也越来越成熟。编程,这样一件在大众视野下普遍被认为门槛很高的事情,也逐渐变得民主化。一些学习能力和动手能力比较强的人,也被称为 AI 时代的超级个体。
2025年的AI行业,进入了一种奇特的高烧状态。
如今,凭借高效叙事与普适共鸣风靡全球的中国短剧,正在成为拯救好莱坞票房颓势、缓解经营压力的 “续命密钥”。
“2025 年可能是未来十年 AI 最被低估的一年。”
11 月 30 日,真格举办了一场关于 AI 创业的分享活动。真格管理合伙人戴雨森与 Kimi 总裁张予彤、与爱为舞创始人张怀亭、Manus 联合创始人张涛一同走进清华大学,带来了一场关于创新与未来的深度对谈。
生成式模型正在成为机器人和具身智能领域的重要范式,它能够从高维视觉观测中直接生成复杂、灵活的动作策略,在操作、抓取等任务中表现亮眼。但在真实系统中,这类方法仍面临两大「硬伤」:一是训练极度依赖大规模演示数据,二是推理阶段需要大量迭代,动作生成太慢,难以实时控制。
今天,小米发布并开源了最新MoE大模型MiMo-V2-Flash,总参数309B,激活参数15B。今日上午,小米2025小米人车家全生态合作伙伴大会上,Xiaomi MiMO大模型负责人罗福莉将首秀并发布主题演讲。
我一直认为,互联网最大的悖论就在于此:信息从未如此丰富,但真正有效的学习却从未如此困难。直到最近,我注意到一家叫 Oboe 的公司刚刚完成了 1600 万美元的 A 轮融资,由 a16z 领投。