AI资讯新闻榜单内容搜索-DIT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DIT
无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

在高质量视频生成任务中,扩散模型(Diffusion Models)已经成为主流。然而,随着视频长度和分辨率的提升,Diffusion Transformer(DiT)模型中的注意力机制计算量急剧增加,成为推理效率的最大瓶颈。

来自主题: AI技术研报
5858 点击    2025-06-28 16:09
AgentAuditor: 让智能体安全评估器的精确度达到人类水平

AgentAuditor: 让智能体安全评估器的精确度达到人类水平

AgentAuditor: 让智能体安全评估器的精确度达到人类水平

LLM 智能体(LLM Agent)正从 “纸上谈兵” 的文本生成器,进化为能自主决策、执行复杂任务的 “行动派”。它们可以使用工具、实时与环境互动,向着通用人工智能(AGI)大步迈进。然而,这份 “自主权” 也带来了新的问题:智能体在自主交互中,是否安全?

来自主题: AI技术研报
6048 点击    2025-06-27 15:39
单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

普林斯顿大学和Meta联合推出的新框架LinGen,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂度压到线性复杂度,使单张GPU就能在分钟级长度下生成高质量视频,大幅提高了模型的可扩展性和生成效率。

来自主题: AI技术研报
6478 点击    2025-06-19 12:07
出海赚美金:用n8n搭建「Reddit商机搜索与洞察」 AI Agent自动化寻找蓝海市场,发现真实痛点

出海赚美金:用n8n搭建「Reddit商机搜索与洞察」 AI Agent自动化寻找蓝海市场,发现真实痛点

出海赚美金:用n8n搭建「Reddit商机搜索与洞察」 AI Agent自动化寻找蓝海市场,发现真实痛点

前天,生财有术的老板亦仁发布了一条「超级标」(至少价值千万以上的现象级行业机会): 随着GPT-4o图像革命而来的,是无数的创业机会。

来自主题: AI技术研报
6537 点击    2025-06-09 16:41
我谈不过 AI,但 AI 能替我谈 1000 次恋爱

我谈不过 AI,但 AI 能替我谈 1000 次恋爱

我谈不过 AI,但 AI 能替我谈 1000 次恋爱

只管填个资料,AI 就帮你搞定一切:从精准匹配到约会地点的挑选,再到时间安排,甚至还附赠一张定制化「约会海报」。最后,只需要拎包出门,赴一场线下约会。这不再是科幻剧《黑镜》的剧情,而是加州大学伯克利分校两位辍学 00 后学生打造的 Ditto——一款试图用 AI 重塑恋爱方式约会应用。

来自主题: AI资讯
7702 点击    2025-06-09 12:11
原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

来自中国人民大学高瓴人工智能学院与值得买科技 AI 团队在 CVPR 2025 会议上发表了一项新工作,首次提出了一种从静态图像直接生成同步音视频内容的生成框架。其核心设计 JointDiT(Joint Diffusion Transformer)框架实现了图像 → 动态视频 + 声音的高质量联合生成。

来自主题: AI技术研报
7588 点击    2025-05-29 14:20
ICML 2025 | 如何在合成文本数据时避免模型崩溃?

ICML 2025 | 如何在合成文本数据时避免模型崩溃?

ICML 2025 | 如何在合成文本数据时避免模型崩溃?

随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。

来自主题: AI技术研报
7190 点击    2025-05-14 14:04
胜过 Cursor、Windsurf?60 万行 Rust 打造的“世界上最快的 AI 代码编辑器”来了!

胜过 Cursor、Windsurf?60 万行 Rust 打造的“世界上最快的 AI 代码编辑器”来了!

胜过 Cursor、Windsurf?60 万行 Rust 打造的“世界上最快的 AI 代码编辑器”来了!

本周三,Zed 宣布推出全新的 Agentic Editor 功能,并声称其为目前市场上速度最快的 AI 代码编辑器。此举无疑将加剧开发者在选择代码编辑器时的考量,使得原本就备受关注的编辑器之争更趋激烈。

来自主题: AI资讯
7942 点击    2025-05-10 10:45
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节开源图像编辑新方法,比当前SOTA方法提高9.19%的性能,只用了1/30的训练数据和1/13参数规模的模型。

来自主题: AI技术研报
6806 点击    2025-05-08 09:52
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰,获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之,仅用以往工作0.1%的数据量(获取自公开数据集)和1%的训练参数,以极低成本实现了图像的高质量编辑,在一些方面媲美甚至超越商业大模型!

来自主题: AI技术研报
9035 点击    2025-05-07 14:49