AI资讯新闻榜单内容搜索-Emu3

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Emu3

DeepSeek之后，智源大模型登Nature：事关“世界模型”统治路线！

DeepSeek之后，智源大模型登Nature：事关“世界模型”统治路线！

DeepSeek之后，智源大模型登Nature：事关“世界模型”统治路线！

来自主题: AI技术研报

8635 点击 2026-02-02 10:32

让AI像人类画家一样边画边想，港中文&美团让模型「走一步看一步」

让AI像人类画家一样边画边想，港中文&美团让模型「走一步看一步」

让AI像人类画家一样边画边想，港中文&美团让模型「走一步看一步」

在文生图（Text-to-Image）和视频生成领域，以FLUX.1、Emu3为代表的扩散模型与自回归模型已经能生成极其逼真的画面。

来自主题: AI技术研报

10328 点击 2025-12-22 16:05

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

近一年以来，统一理解与生成模型发展十分迅速，该任务的主要挑战在于视觉理解和生成任务本身在网络层间会产生冲突。早期的完全统一模型（如 Emu3）与单任务的方法差距巨大，Janus-Pro、BAGEL 通过一步一步解耦模型架构，极大地减小了与单任务模型的性能差距，后续方法甚至通过直接拼接现有理解和生成模型以达到极致的性能。

来自主题: AI技术研报

8403 点击 2025-12-02 15:17

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

最新最强的开源原生多模态世界模型—— 北京智源人工智能研究院（BAAI）的悟界·Emu3.5来炸场了。图、文、视频任务一网打尽，不仅能画图改图，还能生成图文教程，视频任务更是增加了物理真实性。

来自主题: AI资讯

7609 点击 2025-11-01 09:36

刚刚，智源悟界·Emu3.5重塑世界模型格局，原生具备世界建模能力

刚刚，智源悟界·Emu3.5重塑世界模型格局，原生具备世界建模能力

刚刚，智源悟界·Emu3.5重塑世界模型格局，原生具备世界建模能力

今天，北京智源人工智能研究院（BAAI）重磅发布了其多模态系列模型的最新力作 —— 悟界・Emu3.5。这不仅仅是一次常规的模型迭代，Emu3.5 被定义为一个 “多模态世界大模型”（Multimodal World Foudation Model）。

来自主题: AI资讯

9069 点击 2025-10-30 18:07

刚刚，智源全新「悟界」系列大模型炸场！AI第一次真正「看见」宏观-微观双宇宙

刚刚，智源全新「悟界」系列大模型炸场！AI第一次真正「看见」宏观-微观双宇宙

刚刚，智源全新「悟界」系列大模型炸场！AI第一次真正「看见」宏观-微观双宇宙

AI 开始从理解文字，全面进化到建模世界、操控实体、模拟大脑、解构分子。

来自主题: AI资讯

7331 点击 2025-06-07 11:20

Ilya观点得证！仅靠预测下一个token统一图像文本视频，智源发布原生多模态世界模型Emu3

Ilya观点得证！仅靠预测下一个token统一图像文本视频，智源发布原生多模态世界模型Emu3

Ilya观点得证！仅靠预测下一个token统一图像文本视频，智源发布原生多模态世界模型Emu3

OpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点：只要能够非常好的预测下一个token，就能帮助人类达到通用人工智能（AGI）。

来自主题: AI资讯

6451 点击 2024-10-21 14:39

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

OpenAI 前首席科学家、联合创始人 Ilya Sutskever 曾在多个场合表达观点：只要能够非常好的预测下一个 token，就能帮助人类达到通用人工智能（AGI）。

来自主题: AI资讯

4503 点击 2024-10-21 14:23

上一页当前第1页,共1页下一页