AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
OpenAI突然公布SearchGPT,谷歌搜索大敌已至

OpenAI突然公布SearchGPT,谷歌搜索大敌已至

OpenAI突然公布SearchGPT,谷歌搜索大敌已至

靴子终于落地,OpenAI的AI搜索还是来了。7月26日,就在推出小模型GPT-4o mini的一周后,OpenAI方面公布了备受外界关注的搜索产品SearchGPT。尽管目前SearchGPT仅向10000名测试用户开放,但OpenAI CTO Mira Murati在社交平台已经透露,最终目标是将搜索功能直接整合到ChatGPT中。

来自主题: AI技术研报
7463 点击    2024-08-05 12:26
最强开源文生图模型一夜易主,SD原班人马打造,要发SOTA视频生成模型

最强开源文生图模型一夜易主,SD原班人马打造,要发SOTA视频生成模型

最强开源文生图模型一夜易主,SD原班人马打造,要发SOTA视频生成模型

最强开源文生图模型一夜易主! 智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。

来自主题: AI技术研报
6645 点击    2024-08-05 12:06
AI顶会ICML收了一篇论文:没算法没实验

AI顶会ICML收了一篇论文:没算法没实验

AI顶会ICML收了一篇论文:没算法没实验

没有算法没有实验,从2610篇收录论文中脱颖而出,成为唯一一篇纯理论入选2024 ICML Spotlight的论文。

来自主题: AI技术研报
9161 点击    2024-08-04 14:14
可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

本文首先简单回顾了『等效交互可解释性理论体系』(20 篇 CCF-A 及 ICLR 论文),并在此基础上,严格推导并预测出神经网络在训练过程中其概念表征及其泛化性的动力学变化,即在某种程度上,我们可以解释在训练过程中神经网络在任意时间点的泛化性及其内在根因。

来自主题: AI技术研报
8742 点击    2024-08-04 13:55
领英 AI 落地复盘:多 Agent 配合、端到端输出

领英 AI 落地复盘:多 Agent 配合、端到端输出

领英 AI 落地复盘:多 Agent 配合、端到端输出

在过去的六个月,LinkedIn 开发了基于自身业务的生成式AI应用。领英团队希望能重新设计求职流程,改变专业内容的浏览方式。

来自主题: AI技术研报
9983 点击    2024-08-04 13:26
DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind最近被ICML 2024接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本,大概是Llama 3预训练的15%,耗费资金可达12.9M美元。

来自主题: AI技术研报
7692 点击    2024-08-03 15:03
GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

图文并茂的PDF长文档在日常生活中无处不在。过去人们通常使用OCR,layout detection等方法对PDF长文档进行解析。但随着多模态大模型的发展,PDF长文档的端到端阅读理解成为了可能。

来自主题: AI技术研报
9983 点击    2024-08-03 14:38
首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

大模型展现出了卓越的指令跟从和任务泛化的能力,这种独特的能力源自 LLMs 在训练中使用了指令跟随数据以及人类反馈强化学习(RLHF)。

来自主题: AI技术研报
10063 点击    2024-08-03 14:29
顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

热议数月的 Character AI 寻求收购的消息,终于尘埃落定。 据 C.AI 官方博客,公司与 Google 达成协议,核心创始人 Noam Shazeer、Daniel De Freitas 以及研究团队,将加入 Google,剩余「大部分团队」将留在 C.AI,继续打造产品。

来自主题: AI技术研报
5932 点击    2024-08-03 11:22
RAG 高效应用指南 05:再谈文档智能解析

RAG 高效应用指南 05:再谈文档智能解析

RAG 高效应用指南 05:再谈文档智能解析

在这篇文章中,笔者将讨论以下几个问题: • 什么是文档智能解析 • 文档智能解析有哪些方法 • 文档智能解析的开源实现

来自主题: AI技术研报
9318 点击    2024-08-03 11:17
RAG 高效应用指南 04:语义路由

RAG 高效应用指南 04:语义路由

RAG 高效应用指南 04:语义路由

在这篇文章中,笔者将讨论以下几个问题: • 什么是语义路由 • RAG 路由的不同场景

来自主题: AI技术研报
8744 点击    2024-08-03 11:05
RAG 高效应用指南 03:Query 理解

RAG 高效应用指南 03:Query 理解

RAG 高效应用指南 03:Query 理解

在这篇文章中,笔者将讨论以下几个问题: • 为什么要进行 query 理解 • query 理解有哪些技术(从 RAG 角度) • 各种 query 理解技术的实现(基于 LangChain)

来自主题: AI技术研报
10153 点击    2024-08-03 10:57
RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

在本篇文章中,笔者将讨论以下几个问题: • 向量模型在 RAG 系统中的作用 有哪些性能不错的向量模型(从 RAG 角度) 不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量 如何 Finetune 向量模型

来自主题: AI技术研报
11639 点击    2024-08-03 10:44
RAG 高效应用指南:01

RAG 高效应用指南:01

RAG 高效应用指南:01

『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨,提供一系列具体的方法和建议。同时读者也需要记住,提高 RAG 系统性能是一个持续的过程,需要不断地评估、优化和迭代。

来自主题: AI技术研报
11307 点击    2024-08-02 17:11
OpenDevin出技术报告了,大模型Agent开发者必读

OpenDevin出技术报告了,大模型Agent开发者必读

OpenDevin出技术报告了,大模型Agent开发者必读

今年 3 月,「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是,Devin 并不只是辅助编程的角色,而是能够独立地、端到端地完成整个开发项目。

来自主题: AI技术研报
8717 点击    2024-08-02 16:16
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

Llama 3.1 刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报
8701 点击    2024-08-02 16:07
AI金融创新实践|上海「Open Day」圆满落幕

AI金融创新实践|上海「Open Day」圆满落幕

AI金融创新实践|上海「Open Day」圆满落幕

7月25日,非凡产研举办的《金融科技新动力:AI在金融创新与服务中的应用》主题活动在上海圆满落幕。 活动特别邀请到了三位AI+金融领域的资深专家深擎科技创始人&CEO 柴志伟、澜码科技创始人兼CEO 周健、甜新科技合伙人 郭尔东分别进行了专题分享,跟参会嘉宾进行了答疑互动。

来自主题: AI技术研报
8643 点击    2024-08-02 12:02
【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

不同类型的数据配比如何配置:先通过小规模实验确定最优配比,然后将其应用到大模型的训练中。 Token配比结论:通用知识50%;数学与逻辑25%;代码17%;多语言8%。

来自主题: AI技术研报
8898 点击    2024-08-02 11:53
CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。

来自主题: AI技术研报
6462 点击    2024-08-01 15:55
还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

有 AI 在的科技圈,似乎没有中场休息。除了大模型发布不断,各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。

来自主题: AI技术研报
6496 点击    2024-08-01 15:50
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。

来自主题: AI技术研报
5746 点击    2024-08-01 15:41
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。

来自主题: AI技术研报
9133 点击    2024-08-01 15:32