AI资讯新闻榜单内容搜索-向量模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 向量模型
JinaVDR: 一个图文混排文档搜索任务的基准集

JinaVDR: 一个图文混排文档搜索任务的基准集

JinaVDR: 一个图文混排文档搜索任务的基准集

大部分现有的文档检索基准(如MTEB)只考虑了纯文本。而一旦文档的关键信息蕴含在图表、截图、扫描件和手写标记中,这些基准就无能为力。为了更好的开发下一代向量模型和重排器,我们首先需要一个能评测模型在视觉复杂文档能力的基准集。

来自主题: AI技术研报
8612 点击    2025-08-07 14:43
Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

今天,我们正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。

来自主题: AI资讯
8286 点击    2025-06-27 10:14
Correlations:氛围测试你的向量模型

Correlations:氛围测试你的向量模型

Correlations:氛围测试你的向量模型

在今年 ICLR 会议上,我们被问到最多且最有意思的问题是:像 Jina AI 这样的向量搜索模型提供商,除了在 MTEB 上做基准测试,会不会做些氛围测试 (Vibe-testing)?

来自主题: AI技术研报
8126 点击    2025-05-31 15:20
智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。

来自主题: AI资讯
9132 点击    2025-05-20 15:47
多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

就在刚刚,智源研究员联合多所高校开放三款向量模型,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不用怕了!

来自主题: AI技术研报
4912 点击    2025-05-20 14:45
喝下这一碗模型汤,掌握向量模型的训练秘方

喝下这一碗模型汤,掌握向量模型的训练秘方

喝下这一碗模型汤,掌握向量模型的训练秘方

那些曾在KDD时代Kaggle上打榜刷分的老炮儿,每每提起 Bagging 与 Boosting 这两项技术嘴角都压不住笑。

来自主题: AI技术研报
7000 点击    2025-05-10 14:49
文本向量的长度偏差及其在搜索中的影响

文本向量的长度偏差及其在搜索中的影响

文本向量的长度偏差及其在搜索中的影响

向量模型的核心功能是测量语义相似度,但这个测量结果很容易受到多种干扰因素的影响。在本文中,我们将着眼于文本向量模型中一个普遍存在的偏差来源:输入内容的长度。

来自主题: AI技术研报
9050 点击    2025-04-17 14:19
长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。

来自主题: AI技术研报
3953 点击    2025-03-12 15:08
智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

智源联手多所顶尖高校发布的多模态向量模型BGE-VL,重塑了AI检索领域的游戏规则。它凭借独创的MegaPairs合成数据技术,在图文检索、组合图像检索等多项任务中,横扫各大基准刷新SOTA。

来自主题: AI技术研报
3726 点击    2025-03-07 10:34
智源开源多模态向量模型BGE-VL:多模态检索新突破

智源开源多模态向量模型BGE-VL:多模态检索新突破

智源开源多模态向量模型BGE-VL:多模态检索新突破

BGE 系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型 BGE-VL,进一步扩充了原有生态体系。

来自主题: AI技术研报
7215 点击    2025-03-06 17:05