AI技术研报-这里有最前沿的人工智能技术解读

OpenAI突然公布SearchGPT，谷歌搜索大敌已至

靴子终于落地，OpenAI的AI搜索还是来了。7月26日，就在推出小模型GPT-4o mini的一周后，OpenAI方面公布了备受外界关注的搜索产品SearchGPT。尽管目前SearchGPT仅向10000名测试用户开放，但OpenAI CTO Mira Murati在社交平台已经透露，最终目标是将搜索功能直接整合到ChatGPT中。

来自主题: AI技术研报

7463 点击 2024-08-05 12:26

最强开源文生图模型一夜易主，SD原班人马打造，要发SOTA视频生成模型

最强开源文生图模型一夜易主！智东西8月2日报道，昨日晚间，开源文生图模型霸主Stable Diffusion原班人马，宣布推出全新的图像生成模型FLUX.1。

来自主题: AI技术研报

6645 点击 2024-08-05 12:06

AI顶会ICML收了一篇论文：没算法没实验

没有算法没有实验，从2610篇收录论文中脱颖而出，成为唯一一篇纯理论入选2024 ICML Spotlight的论文。

来自主题: AI技术研报

9161 点击 2024-08-04 14:14

阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

你规定路线，Tora 来生成相应轨迹的视频。

来自主题: AI技术研报

8876 点击 2024-08-04 14:01

可解释性终极追问，什么才是第一性解释？20篇CCF-A+ICLR论文给你答案

本文首先简单回顾了『等效交互可解释性理论体系』（20 篇 CCF-A 及 ICLR 论文），并在此基础上，严格推导并预测出神经网络在训练过程中其概念表征及其泛化性的动力学变化，即在某种程度上，我们可以解释在训练过程中神经网络在任意时间点的泛化性及其内在根因。

来自主题: AI技术研报

8742 点击 2024-08-04 13:55

领英 AI 落地复盘：多 Agent 配合、端到端输出

在过去的六个月，LinkedIn 开发了基于自身业务的生成式AI应用。领英团队希望能重新设计求职流程，改变专业内容的浏览方式。

来自主题: AI技术研报

9983 点击 2024-08-04 13:26

DeepMind研究成本大起底，一篇ICML论文烧掉1290万美元

DeepMind最近被ICML 2024接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是Llama 3预训练的15%，耗费资金可达12.9M美元。

来自主题: AI技术研报

7692 点击 2024-08-03 15:03

GPT-4o弱点暴露了，PDF长文档阅读理解仅45分

图文并茂的PDF长文档在日常生活中无处不在。过去人们通常使用OCR，layout detection等方法对PDF长文档进行解析。但随着多模态大模型的发展，PDF长文档的端到端阅读理解成为了可能。

来自主题: AI技术研报

9983 点击 2024-08-03 14:38

鹅厂机器狗登Nature子刊封面：动作敏捷如真狗，能玩定向越野

腾讯机器狗，登上了Nature子刊封面！

来自主题: AI技术研报

8773 点击 2024-08-03 14:35

首届大模型顶会COLM 高分论文：偏好搜索算法PairS，让大模型进行文本评估更高效

大模型展现出了卓越的指令跟从和任务泛化的能力，这种独特的能力源自 LLMs 在训练中使用了指令跟随数据以及人类反馈强化学习（RLHF）。

来自主题: AI技术研报

10063 点击 2024-08-03 14:29

ICML 2024演讲爆火！Meta朱泽园揭秘大模型内心世界：不同于人类的2级推理

大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？

来自主题: AI技术研报

9058 点击 2024-08-03 14:25

顶级明星公司Character.AI创始人出走：我们都身在一个十字路口

热议数月的 Character AI 寻求收购的消息，终于尘埃落定。据 C.AI 官方博客，公司与 Google 达成协议，核心创始人 Noam Shazeer、Daniel De Freitas 以及研究团队，将加入 Google，剩余「大部分团队」将留在 C.AI，继续打造产品。

来自主题: AI技术研报

5932 点击 2024-08-03 11:22

RAG 高效应用指南 05：再谈文档智能解析

在这篇文章中，笔者将讨论以下几个问题： • 什么是文档智能解析 • 文档智能解析有哪些方法 • 文档智能解析的开源实现

来自主题: AI技术研报

9318 点击 2024-08-03 11:17

RAG 高效应用指南 04：语义路由

在这篇文章中，笔者将讨论以下几个问题： • 什么是语义路由 • RAG 路由的不同场景

来自主题: AI技术研报

8744 点击 2024-08-03 11:05

RAG 高效应用指南 03：Query 理解

在这篇文章中，笔者将讨论以下几个问题： • 为什么要进行 query 理解 • query 理解有哪些技术（从 RAG 角度） • 各种 query 理解技术的实现（基于 LangChain）

来自主题: AI技术研报

10153 点击 2024-08-03 10:57

RAG 高效应用指南 02：Embedding 模型的选择和微调

在本篇文章中，笔者将讨论以下几个问题： • 向量模型在 RAG 系统中的作用有哪些性能不错的向量模型（从 RAG 角度）不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量如何 Finetune 向量模型

来自主题: AI技术研报

11639 点击 2024-08-03 10:44

RAG 高效应用指南：01

『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨，提供一系列具体的方法和建议。同时读者也需要记住，提高 RAG 系统性能是一个持续的过程，需要不断地评估、优化和迭代。

来自主题: AI技术研报

11307 点击 2024-08-02 17:11

OpenDevin出技术报告了，大模型Agent开发者必读

今年 3 月，「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是，Devin 并不只是辅助编程的角色，而是能够独立地、端到端地完成整个开发项目。

来自主题: AI技术研报

8717 点击 2024-08-02 16:16

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住了

Llama 3.1 刚刚发布，你是否已经尝试了呢？就算你的个人计算机是最近的顶尖配置，运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报

8701 点击 2024-08-02 16:07

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

10263 点击 2024-08-02 14:26

起猛了，GPT-4o被谷歌新模型击败，ChatGPT官号：大家深吸一口气

起猛了，GPT-4o被谷歌新模型超越了！

来自主题: AI技术研报

8759 点击 2024-08-02 14:18

人间一年，AI时代发电厂在京浮出水面！国产芯片集结，智能算力开箱即用

人工智能毫无疑问是当今一项重要议题，通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。

来自主题: AI技术研报

9861 点击 2024-08-02 14:10

OpenAI喜提姚班学霸姚顺雨：思维树作者，普林斯顿博士，还是个Rapper

清华姚班学霸姚顺雨，官宣加入了OpenAI。

来自主题: AI技术研报

10277 点击 2024-08-02 14:06

AI金融创新实践｜上海「Open Day」圆满落幕

7月25日，非凡产研举办的《金融科技新动力：AI在金融创新与服务中的应用》主题活动在上海圆满落幕。活动特别邀请到了三位AI+金融领域的资深专家深擎科技创始人&CEO 柴志伟、澜码科技创始人兼CEO 周健、甜新科技合伙人郭尔东分别进行了专题分享，跟参会嘉宾进行了答疑互动。

来自主题: AI技术研报

8643 点击 2024-08-02 12:02

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

不同类型的数据配比如何配置:先通过小规模实验确定最优配比，然后将其应用到大模型的训练中。 Token配比结论：通用知识50%；数学与逻辑25%；代码17%；多语言8%。

来自主题: AI技术研报

8898 点击 2024-08-02 11:53

CMU&清华新作：让LLM自己合成数据来学习，特定任务性能同样大幅提升

为了解决这个问题，一些研究尝试通过强大的 Teacher Model 生成训练数据，来增强 Student Model 在特定任务上的性能。然而，这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下，如何持续迭代模型的能力，成为了亟待解决的问题。

来自主题: AI技术研报

6462 点击 2024-08-01 15:55

还没排上SearchGPT？比Perplexity更好用的国产开源平替了解一下？

有 AI 在的科技圈，似乎没有中场休息。除了大模型发布不断，各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。

来自主题: AI技术研报

6496 点击 2024-08-01 15:50

开放域检测新SOTA！中山大学美团出品，开源性能最强

开放域检测领域，迎来新进展——

来自主题: AI技术研报

9039 点击 2024-08-01 15:47

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

今年 6 月底，谷歌开源了 9B、27B 版 Gemma 2 模型系列，并且自亮相以来，27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一，在真实对话任务中比其两倍规模以上的模型表现还要好。

来自主题: AI技术研报

5746 点击 2024-08-01 15:41

iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微镜剖解LLM大脑

谷歌DeepMind的小模型核弹来了，Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B！而同时发布的Gemma Scope，如显微镜一般打破LLM黑箱，让我们看清Gemma 2是如何决策的。

来自主题: AI技术研报

9133 点击 2024-08-01 15:32