AI资讯新闻榜单内容搜索-模型训练

可解释性终极追问，什么才是第一性解释？20篇CCF-A+ICLR论文给你答案

本文首先简单回顾了『等效交互可解释性理论体系』（20 篇 CCF-A 及 ICLR 论文），并在此基础上，严格推导并预测出神经网络在训练过程中其概念表征及其泛化性的动力学变化，即在某种程度上，我们可以解释在训练过程中神经网络在任意时间点的泛化性及其内在根因。

来自主题: AI技术研报

9927 点击 2024-08-04 13:55

DeepMind最近被ICML 2024接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是Llama 3预训练的15%，耗费资金可达12.9M美元。

来自主题: AI技术研报

8438 点击 2024-08-03 15:03

大模型展现出了卓越的指令跟从和任务泛化的能力，这种独特的能力源自 LLMs 在训练中使用了指令跟随数据以及人类反馈强化学习（RLHF）。

来自主题: AI技术研报

11075 点击 2024-08-03 14:29

大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？

来自主题: AI技术研报

10238 点击 2024-08-03 14:25

在这篇文章中，笔者将讨论以下几个问题： • 什么是语义路由 • RAG 路由的不同场景

来自主题: AI技术研报

10186 点击 2024-08-03 11:05

在这篇文章中，笔者将讨论以下几个问题： • 为什么要进行 query 理解 • query 理解有哪些技术（从 RAG 角度） • 各种 query 理解技术的实现（基于 LangChain）

来自主题: AI技术研报

12420 点击 2024-08-03 10:57

在本篇文章中，笔者将讨论以下几个问题： • 向量模型在 RAG 系统中的作用有哪些性能不错的向量模型（从 RAG 角度）不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量如何 Finetune 向量模型

来自主题: AI技术研报

13872 点击 2024-08-03 10:44

灵活评估任意系统，轻松添加实验工具。

来自主题: AI资讯

3999 点击 2024-08-03 09:21

『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨，提供一系列具体的方法和建议。同时读者也需要记住，提高 RAG 系统性能是一个持续的过程，需要不断地评估、优化和迭代。

来自主题: AI技术研报

12473 点击 2024-08-02 17:11

Llama 3.1 刚刚发布，你是否已经尝试了呢？就算你的个人计算机是最近的顶尖配置，运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报

9972 点击 2024-08-02 16:07