AI资讯新闻榜单内容搜索-DiT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DiT
美团开源“语音克隆”模型,1B/3.5B双选,超自然复刻你的声音

美团开源“语音克隆”模型,1B/3.5B双选,超自然复刻你的声音

美团开源“语音克隆”模型,1B/3.5B双选,超自然复刻你的声音

相似度超越Seed-TTS、MiniMax-Speech等知名模型。昨晚,美团LongCat团队发布了文本转语音模型LongCat-AudioDiT,并开源1B、3.5B参数量的版本。这一模型的最大特点,是彻底抛弃了梅尔谱等中间表示,直接在波形潜空间进行基于扩散模型的文本转语音。通俗地说,这一模型直接根据声音本身的规律进行生成,“雕刻”出最原始的声音波形,从根源阻断数据转换的级联误差。

来自主题: AI资讯
8167 点击    2026-04-02 13:51
这是一个划时代的生图模型,一手实测Wan2.7-Image

这是一个划时代的生图模型,一手实测Wan2.7-Image

这是一个划时代的生图模型,一手实测Wan2.7-Image

3月30日,阿里巴巴内部发布了 Wan2.7-Image 图像生成与编辑统一模型。根据官方公布的数据,在人类偏好盲测评分中,Wan2.7-Image 目前位列国内第一。从放出的评测雷达图来看,无论是文本生图(Text-to-Image)还是综合图像编辑(Image Editing),它的各项指标基本都盖过了市面上主流的几家头部模型。

来自主题: AI资讯
8090 点击    2026-04-02 10:42
搞懂“记忆”必看|吃透Engram,坐等Deepseek新模型

搞懂“记忆”必看|吃透Engram,坐等Deepseek新模型

搞懂“记忆”必看|吃透Engram,坐等Deepseek新模型

第一篇论文来自字节SEED团队, 打了一些基础; 《Over-Tokenized Transformer》。 论文标题看上去在讨论“过度分词”。 而重点必然是在第二篇上—— DeepSeek公司的学术成果Engram。 《Conditional Memory via Scalable Lookup》 也就是Engram模块所出处的论文。

来自主题: AI技术研报
9663 点击    2026-03-31 10:30
Claude手搓3D建筑编辑器火爆GitHub!数万年费的专业软件瑟瑟发抖

Claude手搓3D建筑编辑器火爆GitHub!数万年费的专业软件瑟瑟发抖

Claude手搓3D建筑编辑器火爆GitHub!数万年费的专业软件瑟瑟发抖

在GitHub上上线没几天就冲到5.4k stars的3D建筑编辑器开源项目——Pascal Editor。设计软件咱见的不少,但跑在浏览器里的还是有点新鲜,我帮大家浅浅总结了一下Pascal Editor的一些核心亮点:

来自主题: AI资讯
8423 点击    2026-03-29 13:00
湾区智造|毕鲁斯重磅发布 Billus-060C:我们终于做到了从 0 到 1 的突破

湾区智造|毕鲁斯重磅发布 Billus-060C:我们终于做到了从 0 到 1 的突破

湾区智造|毕鲁斯重磅发布 Billus-060C:我们终于做到了从 0 到 1 的突破

3月23日,在DIA「湾区智造」论坛上,毕鲁斯人工智能正式发布 Billus-060C-EDIT-image。为了这一刻,我们潜心打磨,终于在建筑与工业设计领域,实现了从 0 到 1 的技术研发突破。

来自主题: AI资讯
8434 点击    2026-03-25 10:43
用Rust重写OpenClaw,Transformer作者下场造了安全版「龙虾」

用Rust重写OpenClaw,Transformer作者下场造了安全版「龙虾」

用Rust重写OpenClaw,Transformer作者下场造了安全版「龙虾」

面对 OpenClaw(龙虾)可能存在的「恶意利用用户数据和资金」的重大风险,Transformer 八子之一 Illia Polosukhin 出手了。今天,Illia Polosukhin 在 Reddit 上发了一则帖子,深谈了其使用 Rust 来构建安全版 OpenClaw 的心路历程,引起了热议。

来自主题: AI资讯
8248 点击    2026-03-07 11:10
基础模型又一关键拼图,腾讯混元发布训练新范式「无相」:引入功能性记忆,打破静态权重枷锁

基础模型又一关键拼图,腾讯混元发布训练新范式「无相」:引入功能性记忆,打破静态权重枷锁

基础模型又一关键拼图,腾讯混元发布训练新范式「无相」:引入功能性记忆,打破静态权重枷锁

3月6日,腾讯混元发布了一篇名为“HY-WU (Part I): An Extensible Functional Neural Memory Framework and An Instantiation in Text-Guided Image Editing”的技术报告。提出了一种崭新的功能性记忆(functional neural memory)范式(weight unleashing),

来自主题: AI技术研报
8648 点击    2026-03-07 11:08
分享一个贼牛的开源项目Edit banana,让你轻松肢解 AI 图

分享一个贼牛的开源项目Edit banana,让你轻松肢解 AI 图

分享一个贼牛的开源项目Edit banana,让你轻松肢解 AI 图

莫理这两天在 GitHub 上淘到了一个开源的实用工具,刚好能把这块短板给彻底补齐!这就是咱们今天的主角:Edit Banana,通用内容再编辑器。

来自主题: AI资讯
8658 点击    2026-03-03 14:29
Ditto融资920万美金,让AI帮你安排约会,做AI时代的Facebook

Ditto融资920万美金,让AI帮你安排约会,做AI时代的Facebook

Ditto融资920万美金,让AI帮你安排约会,做AI时代的Facebook

当我深入了解Ditto的运作方式后,我发现这不仅仅是一个新的约会服务,而是对整个约会行业商业模式的根本性挑战。传统约会App的商业逻辑是让你尽可能长时间地停留在App上,因为这样才能产生更多广告收入和会员订阅。

来自主题: AI资讯
8304 点击    2026-02-11 12:36