AI资讯新闻榜单内容搜索-模型训练

embedding分数不是唯一解！搜索场景，如何根据元数据做加权rerank

今天聊一聊我们如何做高质量rerank。

来自主题: AI技术研报

9634 点击 2025-12-18 09:43

刷榜自动驾驶语义场景补全！北大新作：高维度、高密度 | AAAI'26

北京大学团队提出了一种新的视觉语义场景补全方法HD²-SSC，用于从多视角图像重建三维语义场景。该方法通过高维度语义解耦和高密度占用优化，解决了现有技术中二维输入与三维输出之间的维度差异，以及人工标注与真实场景密度差异的问题，从而实现更准确的语义场景补全。

来自主题: AI技术研报

6102 点击 2025-12-18 09:14

比LoRA更快更强，全新框架LoFA上线，秒级适配大模型

在个性化视觉生成的实际应用中，通用视觉基础模型的表现往往难以满足精准需求。为实现高度定制化的生成效果，通常需对大模型进行针对性的自适应微调，但当前以 LoRA 为代表的主流方法，仍受限于定制化数据收集与冗长的优化流程，耗时耗力，难以在真实场景中广泛应用。

来自主题: AI技术研报

5921 点击 2025-12-18 09:12

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

LLM 智能体很赞，正在成为一种解决复杂难题的强大范式。

来自主题: AI技术研报

8292 点击 2025-12-17 14:58

VGGT4D：无需训练，挖掘3D基础模型潜力，实现4D动态场景重建

如何让针对静态场景训练的 3D 基础模型（3D Foundation Models）在不增加训练成本的前提下，具备处理动态 4D 场景的能力？

来自主题: AI技术研报

6865 点击 2025-12-17 14:38

56倍加速生成式策略：西交大提出EfficientFlow，迈向高效具身智能

生成式模型正在成为机器人和具身智能领域的重要范式，它能够从高维视觉观测中直接生成复杂、灵活的动作策略，在操作、抓取等任务中表现亮眼。但在真实系统中，这类方法仍面临两大「硬伤」：一是训练极度依赖大规模演示数据，二是推理阶段需要大量迭代，动作生成太慢，难以实时控制。

来自主题: AI技术研报

5469 点击 2025-12-17 09:55

浙大联手字节：开源大规模指令跟随视频编辑数据集OpenVE-3M

作者提出了一个大规模、高质量、多类别的指令跟随的视频编辑数据集 OpenVE-3M，共包含 3M 样本对，分为空间对齐和非空间对齐 2 大类别共 8 小类别。

来自主题: AI技术研报

6915 点击 2025-12-17 09:22

AI Agent最新「Memory」综述｜多所顶尖机构联合发布

就在昨天，新加坡国立大学、中国人民大学、复旦大学等多所顶尖机构联合发布了一篇AI Agent 记忆（Memory）综述。

来自主题: AI技术研报

7763 点击 2025-12-17 09:21

OpenAI最强产品负责人：AGI限制在于人，不在LLM！Codex已能待命自我训练，曝内部压缩机制，18天3人上线安卓Sora

从 0 到上线，在OpenAI内部，安卓版 Sora经历的时间只有 28 天，而且期间只用了 2-3 名员工。

来自主题: AI资讯

7047 点击 2025-12-16 16:30

让扩散模型「可解释」不再降质，开启图片编辑新思路

过去三年，扩散模型席卷图像生成领域。以 DiT (Diffusion Transformer) 为代表的新一代架构不断刷新图像质量的极限，让模型愈发接近真实世界的视觉规律。

来自主题: AI技术研报

7312 点击 2025-12-16 16:27

AI资讯新闻榜单内容搜索-模型训练

embedding分数不是唯一解！搜索场景，如何根据元数据做加权rerank

刷榜自动驾驶语义场景补全！北大新作：高维度、高密度 | AAAI'26

比LoRA更快更强，全新框架LoFA上线，秒级适配大模型

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

VGGT4D：无需训练，挖掘3D基础模型潜力，实现4D动态场景重建

56倍加速生成式策略：西交大提出EfficientFlow，迈向高效具身智能

浙大联手字节：开源大规模指令跟随视频编辑数据集OpenVE-3M

AI Agent最新「Memory」综述 ｜多所顶尖机构联合发布

OpenAI最强产品负责人：AGI限制在于人，不在LLM！Codex已能待命自我训练，曝内部压缩机制，18天3人上线安卓Sora

让扩散模型「可解释」不再降质，开启图片编辑新思路

AI Agent最新「Memory」综述｜多所顶尖机构联合发布