AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
刚刚,多模态推理模型QVQ全新开源

刚刚,多模态推理模型QVQ全新开源

刚刚,多模态推理模型QVQ全新开源

QVQ 在人工智能的视觉理解和复杂问题解决能力方面实现了重大突破。在 MMMU 评测中,QVQ 取得了 70.3 的优异成绩,并且在各项数学相关基准测试中相比 Qwen2-VL-72B-Instruct 都有显著提升。通过细致的逐步推理,QVQ 在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的领域表现出色。

来自主题: AI资讯
9361 点击    2024-12-25 08:47
2024 AI大模型年度十大关键词发布丨亿欧年度盘点

2024 AI大模型年度十大关键词发布丨亿欧年度盘点

2024 AI大模型年度十大关键词发布丨亿欧年度盘点

从开源与闭源的竞争,到多模态AI与自监督学习,再到能效优化和AI伦理的深入探讨,AI技术的演进将继续带来前所未有的创新机会。

来自主题: AI资讯
6473 点击    2024-12-24 15:21
李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

李飞飞、谢赛宁团队又有重磅发现了:多模态LLM能够记住和回忆空间,甚至内部已经形成了局部世界模型,表现了空间意识!李飞飞兴奋表示,在2025年,空间智能的界限很可能会再次突破。

来自主题: AI技术研报
7781 点击    2024-12-23 16:22
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

如今,多模态大模型(MLLM)已经在视觉理解领域取得了长足进步,其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势,其有效性表明大语言模型(LLM)拥有了大量固有的视觉知识,使得它们能够在指令调整过程中有效地学习和发展视觉理解。

来自主题: AI技术研报
6925 点击    2024-12-21 11:12
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
6881 点击    2024-12-20 15:59
2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌

2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌

2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌

经过了LLM、RAG、多模态等多轮技术风口的洗礼后,AI智能体的应用现状究竟如何?Langbase公司最近发布的调查报告通过11个关键问题,为我们提供了一份有价值的现状切面。

来自主题: AI资讯
8420 点击    2024-12-19 13:40
28年数据枯竭?AI炼出数据飞轮2.0,智能体+多模态数据湖硬核掘金

28年数据枯竭?AI炼出数据飞轮2.0,智能体+多模态数据湖硬核掘金

28年数据枯竭?AI炼出数据飞轮2.0,智能体+多模态数据湖硬核掘金

面对AI圈疯传的「数据如化石燃料一般正在枯竭」,我们该如何从海量数据中掘金?AI炼出的数据飞轮2.0,或许就是答案。

来自主题: AI资讯
4977 点击    2024-12-19 13:10
家居AI 2.0时代,居然设计家、酷家乐、欧派、百度们找到了哪些落地密码?

家居AI 2.0时代,居然设计家、酷家乐、欧派、百度们找到了哪些落地密码?

家居AI 2.0时代,居然设计家、酷家乐、欧派、百度们找到了哪些落地密码?

今年以来,家居行业正在不断推动AI大模型的技术提升与落地应用,比如群核科技发布了多模态CAD大模型;居然之家与火山引擎合作推动AI大模型、veOmniverse等技术的应用……

来自主题: AI资讯
7181 点击    2024-12-19 12:55