AI资讯新闻榜单内容搜索-CV

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: CV

黑马图像模型被Nano Banana技术负责人点赞！15人华人小队，DDIM之父&CVPR最佳论文作者带队

黑马图像模型被Nano Banana技术负责人点赞！15人华人小队，DDIM之父&CVPR最佳论文作者带队

黑马图像模型被Nano Banana技术负责人点赞！15人华人小队，DDIM之父&CVPR最佳论文作者带队

刚刚，Luma AI甩出全新模型Uni-1，正面对标谷歌Nano Banana Pro和GPT Image 1.5。Uni-1是一个统一的图像理解与生成模型。在官方展示中，Uni-1具备角色姿态迁移、故事板生成、草稿+材质结合参考生成、草稿转漫画、多参考图场景合成、草稿引导的照片编辑、UV贴图生成、带有文字的贺卡海报生成等诸多能力。

来自主题: AI资讯

9799 点击 2026-03-06 15:41

CVPR 2026 | 1B模型也能当多镜头导演？大连理工&快手可灵开源力作MultiShotMaster

CVPR 2026 | 1B模型也能当多镜头导演？大连理工&快手可灵开源力作MultiShotMaster

CVPR 2026 | 1B模型也能当多镜头导演？大连理工&快手可灵开源力作MultiShotMaster

近期，大连理工与快手可灵团队推出了 MultiShotMaster—— 一个高度可控的多镜头视频生成框架，该论文向研究社区展示了即使在 1B 左右的小参数量级模型上，也可以实现导演级的镜头调度和连贯叙事，且支持多图参考、主体运动控制。

来自主题: AI技术研报

9233 点击 2026-03-06 15:06

首次证实RL能让3D模型学会推理，复杂文本描述下生成质量跃升！

首次证实RL能让3D模型学会推理，复杂文本描述下生成质量跃升！

首次证实RL能让3D模型学会推理，复杂文本描述下生成质量跃升！

当GRPO让大模型在数学、代码推理上实现质变，研究团队率先给出答案——首个将强化学习系统性引入文本到3D自回归生成的研究正式诞生，并被CVPR 2026接收。该研究不只是简单移植2D经验，而是针对3D生成的独特挑战，从奖励设计、算法选择、评测基准到训练范式，做了一套完整的系统性探索。

来自主题: AI技术研报

8058 点击 2026-02-27 10:28

破解机器人「慢半拍」难题：南洋理工解决VLA致命短板，动态世界断层领先

破解机器人「慢半拍」难题：南洋理工解决VLA致命短板，动态世界断层领先

破解机器人「慢半拍」难题：南洋理工解决VLA致命短板，动态世界断层领先

当物体在滚动、滑动、被撞飞，机器人还在执行几百毫秒前的动作预测。对动态世界而言，这种延迟，往往意味着失败。

来自主题: AI技术研报

10823 点击 2026-02-10 14:13

有的AI在算命，有的AI在救命

有的AI在算命，有的AI在救命

有的AI在算命，有的AI在救命

准备回家过年了吗？有没有感觉今年回家比去年还堵？据说今年春运流量再创新高，官方预计40天内人员流动量将达95亿人次，其中多数人仍然选择自驾出行，占比达到了8成，人次超过70亿。

来自主题: AI资讯

8820 点击 2026-02-07 14:17

一等奖20万，大佬们出题，最硬核视频生成全球挑战赛开启！

一等奖20万，大佬们出题，最硬核视频生成全球挑战赛开启！

一等奖20万，大佬们出题，最硬核视频生成全球挑战赛开启！

首个AI视频生成全球挑战赛来袭，袁粒、颜水成、程明明、田永鸿、Philip Torr多位大佬发起，20万大奖虚位以待！创作大神还是技术极客？两大赛道总有一个适合你，速速点击报名吧。

来自主题: AI资讯

9460 点击 2025-12-18 09:47

联通破解扩散模型速度质量零和博弈，推理速度提升5倍丨CVPR 2025 Highlight

联通破解扩散模型速度质量零和博弈，推理速度提升5倍丨CVPR 2025 Highlight

联通破解扩散模型速度质量零和博弈，推理速度提升5倍丨CVPR 2025 Highlight

从“在线训练”到“离线建图”，扩散模型速度再突破！

来自主题: AI技术研报

8995 点击 2025-12-01 14:27

视频大模型新基元：用Object Tokens重塑细节感知与指代理解

视频大模型新基元：用Object Tokens重塑细节感知与指代理解

视频大模型新基元：用Object Tokens重塑细节感知与指代理解

被顶会ICCV 2025以554高分接收的视频理解框架来了！

来自主题: AI技术研报

8395 点击 2025-11-28 09:24

解决特斯拉「监督稀疏」难题，DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

解决特斯拉「监督稀疏」难题，DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

解决特斯拉「监督稀疏」难题，DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

在自动驾驶领域，VLA 大模型正从学术前沿走向产业落地的 “深水区”。近日，特斯拉（Tesla）在 ICCV 的分享中，就将其面临的核心挑战之一公之于众 ——“监督稀疏”。

来自主题: AI技术研报

9094 点击 2025-11-17 15:00

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

你是否曾为搭建具身仿真环境耗费数周学习却效果寥寥？是否因人工采集海量交互数据需要高昂成本而望而却步？又是否因找不到足够丰富真实的开放场景让你的智能体难以施展拳脚？

来自主题: AI技术研报

11322 点击 2025-11-12 09:32

上一页当前第7页,共28页下一页