AI资讯新闻榜单内容搜索-向量模型

Jina Embeddings V4: 为搜索而生，多模态多语言向量模型

今天，我们正式发布 jina-embeddings-v4，一款全新的多模态向量模型，参数规模达到 38 亿，并首次实现了对文本与图像的同步处理。

来自主题: AI资讯

11378 点击 2025-06-27 10:14

在今年 ICLR 会议上，我们被问到最多且最有意思的问题是：像 Jina AI 这样的向量搜索模型提供商，除了在 MTEB 上做基准测试，会不会做些氛围测试（Vibe-testing)？

来自主题: AI技术研报

10833 点击 2025-05-31 15:20

检索增强技术在代码及多模态场景中的发挥着重要作用，而向量模型是检索增强体系中的重要组成部分。

来自主题: AI资讯

11713 点击 2025-05-20 15:47

就在刚刚，智源研究员联合多所高校开放三款向量模型，以大优势登顶多项测试基准。其中，BGE-Code-v1直接击穿代码检索天花板，百万行级代码库再也不用怕了！

来自主题: AI技术研报

7664 点击 2025-05-20 14:45

那些曾在KDD时代Kaggle上打榜刷分的老炮儿，每每提起 Bagging 与 Boosting 这两项技术嘴角都压不住笑。

来自主题: AI技术研报

9537 点击 2025-05-10 14:49

向量模型的核心功能是测量语义相似度，但这个测量结果很容易受到多种干扰因素的影响。在本文中，我们将着眼于文本向量模型中一个普遍存在的偏差来源：输入内容的长度。

来自主题: AI技术研报

11098 点击 2025-04-17 14:19

2025 年 2 月发布的 NoLiMA 是一种大语言模型（LLM）长文本理解能力评估方法。不同于传统“大海捞针”（Needle-in-a-Haystack, NIAH）测试依赖关键词匹配的做法，它最大的特点是通过精心设计问题和关键信息，迫使模型进行深层语义理解和推理，才能从长文本中找到答案。

来自主题: AI技术研报

6255 点击 2025-03-12 15:08

智源联手多所顶尖高校发布的多模态向量模型BGE-VL，重塑了AI检索领域的游戏规则。它凭借独创的MegaPairs合成数据技术，在图文检索、组合图像检索等多项任务中，横扫各大基准刷新SOTA。

来自主题: AI技术研报

6368 点击 2025-03-07 10:34

BGE 系列模型自发布以来广受社区好评。近日，智源研究院联合多所高校开发了多模态向量模型 BGE-VL，进一步扩充了原有生态体系。

来自主题: AI技术研报

9889 点击 2025-03-06 17:05

最近，LAION AI 的创始人 Christoph Schuhmann 分享了一个有趣的发现，他指出，文本向量模型似乎存在一个问题：即使句子词序被打乱，模型输出的向量与原句仍然高度相似。

来自主题: AI技术研报

9682 点击 2024-12-29 11:16