AI资讯新闻榜单内容搜索-多模态

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

PreFLMR模型是一个通用的预训练多模态知识检索器，可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。

来自主题: AI资讯

12090 点击 2024-03-25 17:01

通用文档理解新SOTA，多模态大模型TextMonkey来了

通用文档理解新SOTA，多模态大模型TextMonkey来了

通用文档理解新SOTA，多模态大模型TextMonkey来了

最近，华中科技大学和金山的研究人员在多模态大模型 Monkey [1]（Li et al., CVPR2024）工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中，TextMonkey 处于国际领先地位，有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。

来自主题: AI资讯

4031 点击 2024-03-25 16:55

阶跃星辰发布 Step 通用大模型：多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型：多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型：多模态、MoE、万亿模型参数

3 月 23 日，国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品。阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外发布了 Step 系列通用大模型，包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版。

来自主题: AI技术研报

9992 点击 2024-03-25 12:48

闭关一年创业大模型，姜大昕站在AGI呼啸的风中

闭关一年创业大模型，姜大昕站在AGI呼啸的风中

闭关一年创业大模型，姜大昕站在AGI呼啸的风中

我们就是奔着AGI去的，不然这群人聚在一起干嘛?2024年2月，在准备一场分享会的PPT中，前微软全球副总裁、如今的阶跃星辰CEO姜大昕，把他看到的一句评论放进了自我介绍：在微软混得风生水起，怎么想不开创业？

来自主题: AI资讯

8406 点击 2024-03-25 10:15

界面财联社入局AI 国内首个千亿参数多模态金融大模型面市

界面财联社入局AI 国内首个千亿参数多模态金融大模型面市

界面财联社入局AI 国内首个千亿参数多模态金融大模型面市

"财跃F1"：千亿参数金融大模型首发。国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”今天（3月23日）在2024全球开发者先锋大会（GDC）上首发。

来自主题: AI资讯

7053 点击 2024-03-23 21:25

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

具身基础模型突破2D，全新生成式视觉-语言-行动模型3D-VLA，在多项任务中显著提高了推理、多模态生成和规划的能力。

来自主题: AI资讯

5695 点击 2024-03-23 13:42

吴恩达：AI智能体工作流今年将有巨大进展，可能超过下一代基础模型

吴恩达：AI智能体工作流今年将有巨大进展，可能超过下一代基础模型

吴恩达：AI智能体工作流今年将有巨大进展，可能超过下一代基础模型

下一步是智能体？随着 ChatGPT、GPT-4、Sora 的陆续问世，人工智能的发展趋势引起了广泛关注，特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问：人工智能领域下一个突破方向将会是什么？

来自主题: AI资讯

8935 点击 2024-03-22 17:09

一口气读完《沙丘》，零一万物宝藏API正式开箱！酷炫Demo实测，多模态中文图表体验超越GPT-4V

一口气读完《沙丘》，零一万物宝藏API正式开箱！酷炫Demo实测，多模态中文图表体验超越GPT-4V

一口气读完《沙丘》，零一万物宝藏API正式开箱！酷炫Demo实测，多模态中文图表体验超越GPT-4V

国产大模型独角兽送福利来了，千万token免费用！最近，零一万物API正式开放，三款模型都非常能打，开发者们赶快来开箱吧。零一万物API开放平台，正式向开发者开放了！

来自主题: AI资讯

5116 点击 2024-03-22 16:46

CVPR 2024 | 一统所有目标感知任务，华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务，华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务，华科&字节提出目标感知基础模型GLEE

近年来，LLM 已经一统所有文本任务，展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力，其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务，目前依然缺乏一个强大的基础模型。

来自主题: AI技术研报

10837 点击 2024-03-21 18:35

旷视实战大模型：把多模态扎进行业

旷视实战大模型：把多模态扎进行业

旷视实战大模型：把多模态扎进行业

距离ChatGPT、GPT-4等引爆新一轮人工智能变革的时刻，已经过去了整整一年的时间。在这一年里，国内外大量公司涌入大模型的“斗兽场”，加速大模型技术的迭代与跃迁。

来自主题: AI技术研报

9169 点击 2024-03-20 16:24

上一页当前第93页,共105页下一页