AI资讯新闻榜单内容搜索-Rerank

刚刚！阿里开源 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 模型！图片和视频也可以做RAG了～

今天，Qwen 家族新成员+2，我们正式发布 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 模型系列，这两个模型基于 Qwen3-VL 构建，专为多模态信息检索与跨模态理解设计，为图文、视频等混合内容的理解与检索提供统一、高效的解决方案。

来自主题: AI资讯

10492 点击 2026-01-08 23:28

embedding分数不是唯一解！搜索场景，如何根据元数据做加权rerank

今天聊一聊我们如何做高质量rerank。

来自主题: AI技术研报

10702 点击 2025-12-18 09:43

高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

在大型语言模型（LLM）的应用落地中，RAG（检索增强生成）是解决模型幻觉和知识时效性的关键技术。

来自主题: AI技术研报

10729 点击 2025-12-16 09:18

RAG效果要提升，先搞定高质量Context Pruning

Context Pruning如何结合rerank，优化RAG上下文？

来自主题: AI技术研报

9800 点击 2025-11-28 10:05

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

同样是语义相似度结合时效性做rerank，指数衰减、高斯衰减、线性衰减怎么选？假设你要在一个新闻应用中落地语义检索功能，让用户搜索雷军的投资版图盘点时，能自动关联顺为资本、小米战投等核心关联信息。

来自主题: AI技术研报

10046 点击 2025-11-05 09:46

Jina Reranker v3: 全新“列式”重排器，0.6B参数刷新文档检索SOTA

我们正式推出第三代重排器 Jina Reranker v3。它在多项多语言检索基准上刷新了当前最佳表现（SOTA）。这是一款仅有 6 亿参数的多语言重排模型。我们为其设计了名为 “last but not late” （中文我们译作后发先至）的全新交互机制，使其能接受 Listwise 即列式输入，在一个上下文窗口内一次性完成对查询和所有文档的深度交互。

来自主题: AI技术研报

11238 点击 2025-10-10 13:11