AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
RAG终极框架!港大开源RAG-Anything:统一多模态知识图谱

RAG终极框架!港大开源RAG-Anything:统一多模态知识图谱

RAG终极框架!港大开源RAG-Anything:统一多模态知识图谱

最近,由香港大学黄超教授团队发布的开源项目「一体化的多模态RAG框架」RAG-Anything,有效解决了传统RAG的技术局限,实现了「万物皆可RAG」的处理能力。

来自主题: AI资讯
5811 点击    2025-06-30 15:19
打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力

打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力

打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力

如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。然而,它们在长视频理解和检索等长上下文任务中仍表现不佳。

来自主题: AI技术研报
5900 点击    2025-06-30 10:24
中国首个海洋领域开源大模型OceanGPT(沧渊)发布!海洋精准感知技术全国重点实验室(浙江大学)牵头研发

中国首个海洋领域开源大模型OceanGPT(沧渊)发布!海洋精准感知技术全国重点实验室(浙江大学)牵头研发

中国首个海洋领域开源大模型OceanGPT(沧渊)发布!海洋精准感知技术全国重点实验室(浙江大学)牵头研发

该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发,具备基础的海洋专业知识问答,以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制,相较现有通用大模型能有效降低幻觉式错误。

来自主题: AI资讯
5423 点击    2025-06-29 17:03
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩

拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩

拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩

就在昨夜,阿里带着全新多模态模型Qwen-VLo开启炸场模式。据介绍,Qwen-VLo在阿里原有的多模态理解和生成能力上进行了全面升级,具备三大亮点:

来自主题: AI资讯
6505 点击    2025-06-28 17:57
上海AI企业冲刺港交所:9年干成中国第一AI超级应用,市值218亿

上海AI企业冲刺港交所:9年干成中国第一AI超级应用,市值218亿

上海AI企业冲刺港交所:9年干成中国第一AI超级应用,市值218亿

又一家A股上市公司冲刺“A+H”!6月26日,上海AI产品公司合合信息递表港交所。招股书显示,合合信息是一家原生AI(AI-native)公司,已成为全球多模态大模型文本智能技术的领先者,业务已覆盖全球超过200个国家和地区,3款C端产品拥有数亿全球用户群,是少有的同时在中国和全球拥有成规模用户量的原生AI公司。

来自主题: AI资讯
5389 点击    2025-06-28 12:52
OpenAI员工爆料:已抢先体验GPT-5!7月上线,疑似完全多模态

OpenAI员工爆料:已抢先体验GPT-5!7月上线,疑似完全多模态

OpenAI员工爆料:已抢先体验GPT-5!7月上线,疑似完全多模态

GPT-5,已经被OpenAI员工抢先用上了?就在今天,奥特曼在X上关注了一个神秘人,引起全网猜测。不止两人爆料,自己可能提前体验了GPT-5,甚至也有网友疑似被灰度测试到了。今夏推出的GPT-5,已经掀起全网疯狂!

来自主题: AI资讯
6493 点击    2025-06-27 16:10
Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

今天,我们正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。

来自主题: AI资讯
7909 点击    2025-06-27 10:14
谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型

谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型

谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型

本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。谷歌表示,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。

来自主题: AI资讯
7864 点击    2025-06-27 09:00