AI资讯新闻榜单内容搜索-世界模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 世界模型
李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

一张图,一个3D世界!今天,李飞飞团队重磅放出实时生成世界模型「RTFM」,通过端到端学习大规模视频数据,直接从输入2D图像生成同一场景下新视角的图像。值得一提的是,它仅需单块H100 GPU便能实时渲染出持久且3D一致的世界。

来自主题: AI资讯
8735 点击    2025-10-17 11:55
李飞飞发布全新世界模型,单GPU就能跑!

李飞飞发布全新世界模型,单GPU就能跑!

李飞飞发布全新世界模型,单GPU就能跑!

李飞飞的世界模型创业,最新成果来了!刚刚,教母亲自宣布对外推出全新模型RTFM(A Real-Time Frame Model),不仅具备实时运行、持久性和3D一致性,更关键的是——单张H100 GPU就能跑。

来自主题: AI资讯
10233 点击    2025-10-17 09:08
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型

马斯克从英伟达挖人做AI游戏!第一步:研发世界模型

马斯克从英伟达挖人做AI游戏!第一步:研发世界模型

马斯克的xAI也入局世界模型了!据《金融时报》(FT)报道,为了增加这场“世界模型大混战”的赢面,今年夏天,xAI已经从英伟达挖来了多名资深研究员来助阵。另一边,在悄然下场世界模型后,马斯克几天前又在𝕏上再次重申了去年定下的那个“小目标”——

来自主题: AI资讯
9061 点击    2025-10-13 11:55
任少卿的智驾非共识:世界模型、长时序智能体与 “变态” 工程主义

任少卿的智驾非共识:世界模型、长时序智能体与 “变态” 工程主义

任少卿的智驾非共识:世界模型、长时序智能体与 “变态” 工程主义

任少卿的头发很有辨识度,浓密、微卷,刘海盖住额头。走进会议室,第一次见他的人把他当成了实习生,知道身份后调侃说,只有在 AI 创业公司才能看到这么年轻的技术 leader。

来自主题: AI资讯
9669 点击    2025-10-12 15:00
Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

您修过Bug吗?在Vibe coding的时代之前,当程序员遇到自己写的 Bug 时,通常能顺着自己的思路反推问题所在。但当面对 AI 生成的 Bug 时,情况变得复杂得多,我们不清楚 AI 的“思考

来自主题: AI技术研报
7788 点击    2025-10-09 11:06
Insta360最新全景综述:全景视觉的挑战、方法与未来

Insta360最新全景综述:全景视觉的挑战、方法与未来

Insta360最新全景综述:全景视觉的挑战、方法与未来

本文作者团队来自 Insta360 影石研究院及其合作高校。目前,Insta360 正在面向世界模型、多模态大模型、生成式模型等前沿方向招聘实习生与全职算法工程师,欢迎有志于前沿 AI 研究与落地的同

来自主题: AI技术研报
6689 点击    2025-10-06 14:46
NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型,推动自动驾驶迈向视觉推理

NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型,推动自动驾驶迈向视觉推理

NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型,推动自动驾驶迈向视觉推理

面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介,易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive(FutureSightDrive)提出 “时空视觉 CoT”(Spatio-Temporal Chain-of-Thought),让模型直接 “以图思考”,用统一的未来图像帧作为中间推理步骤,联合未来场景与感知结果进行可视化推理。

来自主题: AI技术研报
7295 点击    2025-10-06 13:42
梦里啥都有?谷歌新世界模型纯靠「想象」训练,学会了在《我的世界》里挖钻石

梦里啥都有?谷歌新世界模型纯靠「想象」训练,学会了在《我的世界》里挖钻石

梦里啥都有?谷歌新世界模型纯靠「想象」训练,学会了在《我的世界》里挖钻石

只让机器人或虚拟智能体「想象」,不让它们和物理世界交互,它们也能学到和世界交互的技能?谷歌的世界模型 Dreamer 4 为这一想法提供了新的支撑。为了在具身环境中解决复杂任务,智能体需要深入理解世界并选择成功的行动。世界模型通过学习从智能体(如机器人或电子游戏玩家)的视角预测潜在行动的未来结果,为实现这一目标提供了一种有前景的方法。

来自主题: AI技术研报
8162 点击    2025-10-03 14:07
大神爆肝一个月,复刻DeepMind世界模型,300万参数就能玩实时交互像素游戏

大神爆肝一个月,复刻DeepMind世界模型,300万参数就能玩实时交互像素游戏

大神爆肝一个月,复刻DeepMind世界模型,300万参数就能玩实时交互像素游戏

最近,X 博主 anandmaj 在一个月内复刻 Genie 3 的核心思想,开发出了 TinyWorlds,一个仅 300 万参数的世界模型,能够实时生成可玩的像素风格环境,包括 Pong、Sonic、Zelda 和 Doom。

来自主题: AI资讯
8557 点击    2025-09-29 11:02
LeCun团队开源首个代码世界模型:能生成代码还能自测自修!传统编程模型一夜成古典

LeCun团队开源首个代码世界模型:能生成代码还能自测自修!传统编程模型一夜成古典

LeCun团队开源首个代码世界模型:能生成代码还能自测自修!传统编程模型一夜成古典

刚刚,Meta FAIR推出了代码世界模型!CWM(Code World Model),一个参数量为32B、上下文大小达131k token的密集语言模型,专为代码生成和推理打造的研究模型。这是全球首个将世界模型系统性引入代码生成的语言模型。

来自主题: AI资讯
9213 点击    2025-09-25 11:20