AI资讯新闻榜单内容搜索-Ai视频

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ai视频
单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满

单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满

单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满

智源研究院发布开源模型Video-XL-2,显著提升长视频理解能力。该模型在效果、处理长度与速度上全面优化,支持单卡处理万帧视频,编码2048帧仅需12秒。

来自主题: AI技术研报
5984 点击    2025-06-03 17:24
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。

来自主题: AI技术研报
5902 点击    2025-06-03 14:44
首发丨某大厂悄咪咪在海外上线 AI 数字人视频工具

首发丨某大厂悄咪咪在海外上线 AI 数字人视频工具

首发丨某大厂悄咪咪在海外上线 AI 数字人视频工具

特工宇宙独家获悉,北京某知名大厂最近在海外上线了一款 AI 驱动的数字人视频创作产品,Keevx。特工宇宙独家获悉,北京某知名大厂最近在海外上线了一款 AI 驱动的数字人视频创作产品,Keevx。

来自主题: AI资讯
7737 点击    2025-06-02 23:33
实测!可灵AI季度收入1.5亿,最新版本正式发布:物理真实感大幅提升

实测!可灵AI季度收入1.5亿,最新版本正式发布:物理真实感大幅提升

实测!可灵AI季度收入1.5亿,最新版本正式发布:物理真实感大幅提升

提质不加价,可灵新版视频生成模型正式登场!新版本依然是一石激起千层浪,不到24小时就有超过72万次阅读。我们也带来了新鲜实测!

来自主题: AI资讯
8957 点击    2025-05-30 17:43
中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。

来自主题: AI技术研报
8959 点击    2025-05-30 12:53
原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

来自中国人民大学高瓴人工智能学院与值得买科技 AI 团队在 CVPR 2025 会议上发表了一项新工作,首次提出了一种从静态图像直接生成同步音视频内容的生成框架。其核心设计 JointDiT(Joint Diffusion Transformer)框架实现了图像 → 动态视频 + 声音的高质量联合生成。

来自主题: AI技术研报
7598 点击    2025-05-29 14:20
第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

就在刚刚,全球首款实时摄像头重磅诞生!从此,AI视频生成的「实时性」和「沉浸感」被重新定义,全行业都有了颠覆性方案。

来自主题: AI资讯
8926 点击    2025-05-28 16:23
豆包为什么要给 AI 助手「开眼」?

豆包为什么要给 AI 助手「开眼」?

豆包为什么要给 AI 助手「开眼」?

当 AI 同时拥有了耳朵和眼睛,在未来硬件创新的支持下,还将解放更大的创新潜力。

来自主题: AI资讯
5938 点击    2025-05-27 13:11