AI资讯新闻榜单内容搜索-STA

RAG太折磨人啦，试一下pip install rankify，检索、重排序、RAG三合一，完美。| 独家

现有RAG工具的碎片化和复杂性常常让开发者头疼不已。昨天我的Agent群里朋友们就Rerank问题展开激烈讨论，我想起之前看到的一篇论文，这项研究介绍了一个完美的开源python工具包Rankify，它将检索、重排序和RAG三大功能整合在一个统一框架中，大幅简化了开发流程。

来自主题: AI技术研报

5460 点击 2025-03-28 09:24

1.9K+ Star！RuoYi AI：一个全栈式 AI 开发平台

RuoYi AI[1] 是一个全栈式 AI 开发平台，目标是帮助开发者快速构建和部署个性化的 AI 应用。它提供了完整的前端应用、后台管理以及小程序应用，基于 MIT 开源协议，开箱即用，适合个人开发者和企业使用。

来自主题: AI资讯

8802 点击 2025-03-28 09:15

Stable Diffusion变身3D神器！一个LoRA将2D图像转3D模型

在Stable Diffusion当中，只需加入一个LoRA就能根据图像创建3D模型了？

来自主题: AI技术研报

8302 点击 2025-03-26 14:56

DeepSeek上脸实测：AR眼镜实时翻译老黄GTC演讲，完了还帮我划重点

DeepSeek、通义千问等大模型 + AR眼镜，打开GTC老黄演讲的姿势，可以是这样：

来自主题: AI资讯

7222 点击 2025-03-21 12:25

CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成，Github Star破千

近年来，扩散模型在图像与视频合成领域展现出强大能力，为图像动画技术的发展带来了新的契机。特别是在人物图像动画方面，该技术能够基于一系列预设姿态驱动参考图像，使其动态化，从而生成高度可控的人体动画视频。

来自主题: AI技术研报

10207 点击 2025-03-20 09:34

无需百卡集群！港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

文本到图像（Text-to-Image, T2I）生成任务近年来取得了飞速进展，其中以扩散模型（如 Stable Diffusion、DiT 等）和自回归（AR）模型为代表的方法取得了显著成果。然而，这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量，导致计算成本高昂、落地困难，难以高效地应用于实际生产环境。

来自主题: AI技术研报

8294 点击 2025-03-20 09:18

速递｜将2D照片转化为3D视频，新模型能否解决Stability AI商业困境

Stability AI 发布了一款新 AI 模型——Stable Virtual Camera，该公司宣称该模型能将 2D 图像转化为，具有真实深度和视角的“沉浸式”视频。

来自主题: AI资讯

8751 点击 2025-03-19 15:08

无需训练，100%完美检索！LLM练出「火眼金睛」，InfiniRetri超长文本一针见血

LLM自身有望在无限长token下检索信息！无需训练，在检索任务「大海捞针」（Needle-in-a-Haystack）测试中，新方法InfiniRetri让有效上下文token长度从32K扩展至1000+K，让7B模型比肩72B模型。

来自主题: AI技术研报

10351 点击 2025-03-16 13:28

米哈游创始人蔡浩宇的AI游戏，今天终于正式曝光了

今日（3月15日），一个名为Stella的用户在多个社交平台发布了一则游戏预告片，游戏名为《Whispers from the Star》，是一款以AI智能体语音交互为核心的太空生存游戏。这款游戏来自Anuttacon，这是一家由米哈游创始人蔡浩宇创立的人工智能公司。公司汇集了多位行业专家

来自主题: AI资讯

11184 点击 2025-03-15 22:12

长文本向量模型在4K Tokens 之外形同盲区？

2025 年 2 月发布的 NoLiMA 是一种大语言模型（LLM）长文本理解能力评估方法。不同于传统“大海捞针”（Needle-in-a-Haystack, NIAH）测试依赖关键词匹配的做法，它最大的特点是通过精心设计问题和关键信息，迫使模型进行深层语义理解和推理，才能从长文本中找到答案。

来自主题: AI技术研报

6262 点击 2025-03-12 15:08