AI资讯新闻榜单内容搜索-模型

刚刚，多模态推理模型QVQ全新开源

QVQ 在人工智能的视觉理解和复杂问题解决能力方面实现了重大突破。在 MMMU 评测中，QVQ 取得了 70.3 的优异成绩，并且在各项数学相关基准测试中相比 Qwen2-VL-72B-Instruct 都有显著提升。通过细致的逐步推理，QVQ 在视觉推理任务中展现出增强的能力，尤其在需要复杂分析思维的领域表现出色。

来自主题: AI资讯

12461 点击 2024-12-25 08:47

蔚来智能驾驶调整：任少卿直接带队大模型，冲刺端到端交付

在智能驾驶行业激烈的“端到端”竞赛中，蔚来汽车计划提升“端到端”高阶智驾方案的交付节奏。

来自主题: AI资讯

4779 点击 2024-12-24 17:48

Hippocratic AI，用垂类大模型和AI代理缓解全球医护人员短缺

Hippocratic AI 的使命是打造首个以安全性为核心的医疗领域大语言模型（LLM）。

来自主题: AI资讯

10094 点击 2024-12-24 17:39

AI视频生成平台全球前3，成本暴降50%方案开源！500元GPU算力免费薅

随着Sora震撼发布，视频生成技术成为了AI领域新风口。不过，高昂的开发成本是一大瓶颈。国产平台Video Ocean不仅成功登上全球热榜第三，还将视频生成模型开发成本降低50%。而且，模型构建和性能优化方案现已开源，还能免费获得500元GPU算力。

来自主题: AI技术研报

5989 点击 2024-12-24 17:09

o3曝智商高达157，比肩爱因斯坦碾压99%人类！陶哲轩水平AI或出现

OpenAI o3的智商，竟然已经高达157，碾压99%的人类？这张OpenAI模型智商图全网疯转。甚至有人大胆预测：达到陶哲轩智商（225-230）的大模型，应该会很快出现了。

来自主题: AI资讯

7922 点击 2024-12-24 16:43

字节整新活！照片+音频让蒙娜丽莎秒变播客主理人

在大语言模型和 AIGC 的热潮下，科研人员对构建「视觉对话智能体」（Visual Chat Agent）展现出极大兴趣。其中，可实时交互的人像生成技术（Audio-Driven Real-Time Interactive Head Generation）是实现链路中极为关键的一环。

来自主题: AI资讯

9517 点击 2024-12-24 15:44

Meta、斯坦福等：AI的下一个前沿，正是陶哲轩说的形式化数学推理

对 AI 研究者来说，数学既是一类难题，也是一个标杆，能够成为衡量 AI 技术的发展重要尺度。近段时间，随着 AI 推理能力的提升，使用 AI 来证明数学问题已经成为一个重要的研究探索方向。

来自主题: AI技术研报

8452 点击 2024-12-24 15:37

行人、车辆、动物等ReID最新综述！武大等全面总结Transformer方法 | IJCV 2024

研究人员对基于Transformer的Re-ID研究进行了全面回顾和深入分析，将现有工作分类为图像/视频Re-ID、数据/标注受限的Re-ID、跨模态Re-ID以及特殊Re-ID场景，提出了Transformer基线UntransReID，设计动物Re-ID的标准化基准测试，为未来Re-ID研究提供新手册。

来自主题: AI技术研报

6479 点击 2024-12-24 15:22

2024 AI大模型年度十大关键词发布丨亿欧年度盘点

从开源与闭源的竞争，到多模态AI与自监督学习，再到能效优化和AI伦理的深入探讨，AI技术的演进将继续带来前所未有的创新机会。

来自主题: AI资讯

8820 点击 2024-12-24 15:21

清华、智谱团队：探索 RLHF 的 scaling laws

目前关于 RLHF 的 scaling（扩展）潜力研究仍然相对缺乏，尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。针对这一问题，来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究，并提出了优化策略。

来自主题: AI技术研报

11089 点击 2024-12-24 14:56