AI资讯新闻榜单内容搜索-DIT

B站神级配音AI被曝光！一个「意外泄露」的视频，让鬼畜区UP主都沉默了

最近一个「泄露」的文本转语音模型演示版本在 Reddit 上火了。这个「泄露」的演示视频被网友贴出来后，评论区一片惊呼。

来自主题: AI资讯

8683 点击 2025-07-15 11:01

EasyCache：无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

近年来，随着扩散模型（Diffusion Models）和扩散 Transformer（DiT）在视频生成领域的广泛应用，AI 合成视频的质量和连贯性有了飞跃式提升。像 OpenAI Sora、HunyuanVideo、Wan2.1 等大模型，已经能够生成结构清晰、细节丰富且高度连贯的长视频内容，为数字内容创作、虚拟世界和多媒体娱乐带来了巨大变革。

来自主题: AI技术研报

8301 点击 2025-07-14 10:42

告别Transformer！北大、北邮、华为开源纯卷积DiC：3x3卷积实现SOTA性能，比DiT快5倍！

当整个 AI 视觉生成领域都在 Transformer 架构上「卷生卷死」时，一项来自北大、北邮和华为的最新研究却反其道而行之，重新审视了深度学习中最基础、最经典的模块——3x3 卷积。

来自主题: AI技术研报

8244 点击 2025-07-14 10:25

ChatGPT破案！成功揭露500万美元遗产欺诈

一起500万美元遗产欺诈案，就这样被ChatGPT揭露了？！相关帖子正在美版贴吧Reddit建起高楼。

来自主题: AI资讯

7650 点击 2025-07-13 13:53

Claude高阶玩法泄露！Reddit高赞帖：别只会对AI说“帮我修这个 bug”，老手都在配置现成指令库！网友：指挥AI是关键

大多数人还在输入一句“帮我修这个 bug”，然后疑惑为什么 Claude 回答得四不像、效率低得离谱。而另一些“老手”已经用上了 slash command，把一个原本要手动操作 45 分钟的流程，缩短到 2 分钟内自动完成。

来自主题: AI资讯

7933 点击 2025-07-09 12:23

Diffusion约2倍无损加速！训练-推理协同的缓存学习框架来了｜ HKUST&北航&商汤

面对扩散模型推理速度慢、成本高的问题，HKUST&北航&商汤提出了全新缓存加速方案——HarmoniCa：训练-推理协同的特征缓存加速框架，突破DiT架构在部署端的速度瓶颈，成功实现高性能无损加速。

来自主题: AI技术研报

8618 点击 2025-07-06 15:05

求医十年，病因不明，ChatGPT：你看起来有基因突变

用AI给自己看病正在成为新趋势，但目前我们仍需要人类医生。身体不适，求医十年，医生没找出原因，ChatGPT 给分析出来了。这是一位 Reddit 网友刚刚分享的个人经历。

来自主题: AI资讯

8099 点击 2025-07-06 14:47

无需训练，即插即用，2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

在高质量视频生成任务中，扩散模型（Diffusion Models）已经成为主流。然而，随着视频长度和分辨率的提升，Diffusion Transformer（DiT）模型中的注意力机制计算量急剧增加，成为推理效率的最大瓶颈。

来自主题: AI技术研报

8074 点击 2025-06-28 16:09

AgentAuditor: 让智能体安全评估器的精确度达到人类水平

LLM 智能体（LLM Agent）正从 “纸上谈兵” 的文本生成器，进化为能自主决策、执行复杂任务的 “行动派”。它们可以使用工具、实时与环境互动，向着通用人工智能（AGI）大步迈进。然而，这份 “自主权” 也带来了新的问题：智能体在自主交互中，是否安全？

来自主题: AI技术研报

7569 点击 2025-06-27 15:39

单GPU搞定高清长视频生成，效率×10！引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

普林斯顿大学和Meta联合推出的新框架LinGen，以MATE线性复杂度块取代传统自注意力，将视频生成从像素数的平方复杂度压到线性复杂度，使单张GPU就能在分钟级长度下生成高质量视频，大幅提高了模型的可扩展性和生成效率。

来自主题: AI技术研报

8552 点击 2025-06-19 12:07