AI资讯新闻榜单内容搜索-Ai

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Ai

RAE+VAE? 预训练表征助力扩散模型Tokenizer，加速像素压缩到语义提取

RAE+VAE? 预训练表征助力扩散模型Tokenizer，加速像素压缩到语义提取

RAE+VAE? 预训练表征助力扩散模型Tokenizer，加速像素压缩到语义提取

近期，RAE（Diffusion Transformers with Representation Autoencoders）提出以「冻结的预训练视觉表征」直接作为潜空间，以显著提升扩散模型的生成性能。

来自主题: AI技术研报

9892 点击 2025-11-14 10:21

LeCun在Meta的最后一篇论文

LeCun在Meta的最后一篇论文

LeCun在Meta的最后一篇论文

《LeJEPA：无需启发式的可证明且可扩展的自监督学习》。

来自主题: AI技术研报

5975 点击 2025-11-14 10:20

下一代目标检测模型：3B参数MLLM Rex-Omni首度超越Grounding DINO，统一10+视觉任务

下一代目标检测模型：3B参数MLLM Rex-Omni首度超越Grounding DINO，统一10+视觉任务

下一代目标检测模型：3B参数MLLM Rex-Omni首度超越Grounding DINO，统一10+视觉任务

多模态大语言模型（MLLM）在目标定位精度上被长期诟病，难以匹敌传统的基于坐标回归的检测器。近日，来自 IDEA 研究院的团队通过仅有 3B 参数的通用视觉感知模型 Rex-Omni，打破了这一僵局。

来自主题: AI技术研报

5426 点击 2025-11-14 10:18

只演示一次，机器人就会干活了？北大&BeingBeyond联合团队用“分层小脑+仿真分身”让G1零样本上岗

只演示一次，机器人就会干活了？北大&BeingBeyond联合团队用“分层小脑+仿真分身”让G1零样本上岗

只演示一次，机器人就会干活了？北大&BeingBeyond联合团队用“分层小脑+仿真分身”让G1零样本上岗

近日，来自北京大学与BeingBeyond的研究团队提出DemoHLM框架，为人形机器人移动操作（loco-manipulation）领域提供一种新思路——仅需1次仿真环境中的人类演示，即可自动生成海量训练数据，实现真实人形机器人在多任务场景下的泛化操作，有效解决了传统方法依赖硬编码、真实数据成本高、跨场景泛化差的核心痛点。

来自主题: AI技术研报

7565 点击 2025-11-14 09:44

Llama 4造假丑闻幕后：小扎豪赌143亿，却为中国AI「做了嫁衣」

Llama 4造假丑闻幕后：小扎豪赌143亿，却为中国AI「做了嫁衣」

Llama 4造假丑闻幕后：小扎豪赌143亿，却为中国AI「做了嫁衣」

Llama4性能造假丑闻，OpenAI烧钱的速度远超过了盈利能力；另外一方面：国产模型凭借足够强大的性能与超高性价比，迅速占领了国际开源模型市场。是时候再次为国产AI鼓掌了！

来自主题: AI资讯

9066 点击 2025-11-14 09:43

用155万模拟视频给模型上课！GVE模型一次学会9种视频检索技能

用155万模拟视频给模型上课！GVE模型一次学会9种视频检索技能

用155万模拟视频给模型上课！GVE模型一次学会9种视频检索技能

当前视频检索研究正陷入一个闭环困境：以MSRVTT为代表的窄域基准，长期主导模型在粗粒度文本查询上的优化，导致训练数据有偏、模型能力受限，难以应对真实世界中细粒度、长上下文、多模态组合等复杂检索需求。

来自主题: AI技术研报

5377 点击 2025-11-14 09:41

王小川的“AI医生梦”，要被蚂蚁做成了？

王小川的“AI医生梦”，要被蚂蚁做成了？

王小川的“AI医生梦”，要被蚂蚁做成了？

AI医疗不是一门新生意，但确是一个“性感”的赛道。

来自主题: AI资讯

6980 点击 2025-11-14 09:40

一个模型读懂所有医学数据，Hulu-Med探索医学大模型开源新范式 | 浙大x上交xUIUC

一个模型读懂所有医学数据，Hulu-Med探索医学大模型开源新范式 | 浙大x上交xUIUC

一个模型读懂所有医学数据，Hulu-Med探索医学大模型开源新范式 | 浙大x上交xUIUC

从影像诊断到手术指导，从多语言问诊到罕见病推理—— 医学AI正在从“专科助手”进化为“全能型选手”。

来自主题: AI技术研报

8264 点击 2025-11-14 09:40

2.4万亿参数原生全模态，文心5.0一手实测来了

2.4万亿参数原生全模态，文心5.0一手实测来了

2.4万亿参数原生全模态，文心5.0一手实测来了

刚刚，文心5.0正式发布了！全新一代主打原生全模态，最开始就把语言/图像/视频/音频放在同一套自回归统一架构里，做统一的理解与生成训练。所以，最终模型能够做到支持全模态输入（文字/图片/音频/视频）+全模态输出（文字/图片/音频/视频），创意写作、指令遵循、智能体规划方面也更强了。

来自主题: AI资讯

8573 点击 2025-11-13 21:01

阿里将向AI C端市场投入一枚重磅

阿里将向AI C端市场投入一枚重磅

阿里将向AI C端市场投入一枚重磅

虎嗅独家获悉，9月后，从北京、广东等地“调”来的超过百位核心工程师，汇聚到了阿里巴巴杭州西溪园区C4楼。此后，C4楼封闭了两层办公楼层，员工需要刷工牌及特殊的安保审批，方能进入。

来自主题: AI资讯

7475 点击 2025-11-13 20:52

上一页当前第5页,共1891页下一页