AI资讯新闻榜单内容搜索-DIT

终于等到开源好用的修图大模型了！阶跃模型三连发，卷疯了多模态赛道

最近在看 Agent 方向的论文和产品，已经被各种进展看花了眼。但我发现，真正能超越 demo，能在 B 端场景扎实落地的却寥寥无几。

来自主题: AI技术研报

9623 点击 2025-04-28 16:40

阶跃星辰开源图像编辑模型Step1X-Edit：一键改图大师，性能达到开源SOTA

阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit，性能达到开源 SOTA。该模型总参数量为 19B (7B MLLM + 12B DiT)，具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力；支持 11 类高频图像编辑任务类型，如文字替换、风格迁移、材质变换、人物修图等。

来自主题: AI资讯

10223 点击 2025-04-27 15:29

质量无损，算力砍半！达摩院开源视觉生成新架构，出道即SOTA｜ICLR 2025

算力砍半，视觉生成任务依然SOTA！

来自主题: AI技术研报

7575 点击 2025-04-25 13:52

都2025年了，人们到底在用AI做什么？国外大牛总结了100个案例

在这篇文章中，我采用了与去年研究人们如何使用 AI 的相同方法，但搜索了更多数据，并将结果限制在过去 12 个月内。我查看了在线论坛（Reddit、Quora）以及包含明确、具体的技术应用的文章。也许是由于其固有的匿名性，Reddit 再次提供了最丰富的见解。我阅读了这些文章，并将每个相关帖子添加到该类别的统计中。几天后，我统计出了 100 个新的使用案例，并逐一引用。

来自主题: AI资讯

9671 点击 2025-04-13 09:59

CVPR 2025 | EmoEdit：情感可编辑？深大VCC带你见证魔法！

当你翻开相册，看到一张平淡无奇的风景照，是否希望它能更温暖、更浪漫，甚至更忧郁？现在，EmoEdit 让这一切成为可能 —— 只需输入一个简单的情感词，EmoEdit 便能巧妙调整画面，使观众感知你想传递的情感。

来自主题: AI技术研报

10716 点击 2025-03-31 09:25

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

，清华大学、北京航空航天大学团队推出了全新的架构设计 ——Personalize Anything，它能够在无需训练的情况下，完成概念主体的高度细节还原，支持用户对物体进行细粒度的位置操控，并能够扩展至多个应用中，为个性化图像生成引入了一个新范式。

来自主题: AI技术研报

8460 点击 2025-03-26 09:04

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

个性化图像生成是图像生成领域的一项重要技术，正以前所未有的速度吸引着广泛关注。它能够根据用户提供的独特概念，精准合成定制化的视觉内容，满足日益增长的个性化需求，并同时支持对生成结果进行细粒度的语义控制与编辑，使其能够精确实现心中的创意愿景。

来自主题: AI技术研报

10544 点击 2025-03-25 14:50

无需百卡集群！港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

文本到图像（Text-to-Image, T2I）生成任务近年来取得了飞速进展，其中以扩散模型（如 Stable Diffusion、DiT 等）和自回归（AR）模型为代表的方法取得了显著成果。然而，这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量，导致计算成本高昂、落地困难，难以高效地应用于实际生产环境。

来自主题: AI技术研报

7939 点击 2025-03-20 09:18

Manus火到国外？网友实测惊呆！00后博士生0天复刻霸榜开源第一

Manus居然成功火到国外了，内销转出口了？今天开始，在X和Reddit上的外国网友中，Manus的讨论声量开始变大了！拿到邀请码的歪果网友实测后赞叹：Manus太好用了。而各种开源复现项目也如雨后春笋一般冒出，人气持续爆棚。

来自主题: AI资讯

9802 点击 2025-03-09 02:01

速递｜前苹果设计师新项目融资400万美元，打造AI创意3D工具

Intangible，现已获得 400 万美元的种子资金支持，提供了一款 AI 驱动的创意工具，让用户通过文本提示创建 3D 世界概念，助力跨行业创意专业人士。a16z Speedrun、Crosslink Capital 和几位天使投资者领投了本轮融资。

来自主题: AI资讯

8556 点击 2025-03-07 14:07