AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

检索增强生成 (RAG) 是将检索模型与生成模型结合起来,以提高生成内容的质量和相关性的一种有效的方法。RAG 的核心思想是利用大量文档或知识库来获取相关信息。各种工具支持 RAG,包括 Langchain 和 LlamaIndex。

来自主题: AI技术研报
10190 点击    2024-06-08 15:45
OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI研究如何破解GPT-4思维,公开超级对齐团队工作,Ilya Sutskever也在作者名单之列。

来自主题: AI技术研报
8710 点击    2024-06-08 12:07
OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

今天,OpenAI发布了一篇GPT-4可解释性的论文,似乎是作为前两天员工联名信的回应。网友细看论文才发现,这居然是已经解散的「超级对齐」团队的「最后之作」。

来自主题: AI技术研报
8762 点击    2024-06-08 11:50
全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了

全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了

全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了

一夜之间,全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世,火速杀进开源LLM排行榜第一,美国最强开源模型Llama3-70B直接被碾压!全球开发者粉丝狂欢:果然没白等。

来自主题: AI技术研报
9344 点击    2024-06-08 11:44
ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

不使用外部工具也能让大语言模型(LLMs)实现严谨可信的推理,新国立提出 SymbCoT 推理框架:结合符号化逻辑(Symbolic Logical)表达式与思维链,极大提升推理质量,鲁棒性与可信度。

来自主题: AI技术研报
9584 点击    2024-06-07 14:39
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

大模型也可解释了?大模型都在想什么?OpenAI 找到了一种办法,能给 GPT-4 做「扫描」,告诉你 AI 的思路,而且还把这种方法开源了。

来自主题: AI技术研报
9162 点击    2024-06-07 14:27
ICML 2024 Oral|外部引导的深度聚类新范式

ICML 2024 Oral|外部引导的深度聚类新范式

ICML 2024 Oral|外部引导的深度聚类新范式

怎样才能将可爱又迷人的柯基与柴犬的图像进行区分?

来自主题: AI技术研报
8609 点击    2024-06-07 10:56
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解决这一难题方面,一种强大的技术是根据人类反馈的强化学习(RLHF)。

来自主题: AI技术研报
9799 点击    2024-06-07 10:36
Cloudflare 宣布 AI Gateway 普遍可用

Cloudflare 宣布 AI Gateway 普遍可用

Cloudflare 宣布 AI Gateway 普遍可用

Cloudflare最近宣布AI Gateway已普遍可用。AI Gateway作为管理和扩展生成式AI工作负载的统一接口,让开发人员能够监控和控制AI应用程序。

来自主题: AI技术研报
9094 点击    2024-06-06 17:14
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升

首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升

首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升

CRATE-α是一种新型Transformer架构变体,通过设计改进提升了模型的可扩展性、性能和可解释性,CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型,其性能会随着模型和数据集规模扩大而继续提升。

来自主题: AI技术研报
9139 点击    2024-06-06 15:48
人类能否创造出有意识的AI?

人类能否创造出有意识的AI?

人类能否创造出有意识的AI?

随着近年来人工智能(AI)的惊人进步,AI 是否具有意识以及如何构建有意识的 AI 系统越来越受到学界和公众的关注。要回答这类问题,我们仍然需要或者必须从意识理论中去寻找灵感和答案。

来自主题: AI技术研报
8876 点击    2024-06-06 15:12
AI大模型会“读心”吗?

AI大模型会“读心”吗?

AI大模型会“读心”吗?

请想象这样一个场景。你坐在公交车上靠窗的位置,这时你的朋友突然对你说:“今天好像有点热”。你会怎么回应?大多数人的做法应该是立即打开窗户,因为他们巧妙地理解了朋友的言外之意:他是在礼貌地请求自己打开窗户,而不是单纯因为无聊而谈论天气。

来自主题: AI技术研报
9008 点击    2024-06-06 15:10
天大、南大发布LPSNet:无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天大、南大发布LPSNet:无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天大、南大发布LPSNet:无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天津大学与南京大学联合团队在CVPR 2024上发表了LPSNet项目,提出了一种端到端的无透镜成像下的3D人体姿态和形状估计框架,通过多尺度无透镜特征解码器和双头辅助监督机制,直接从编码后的无透镜成像数据中提取特征并提高姿态估计的准确度。

来自主题: AI技术研报
8970 点击    2024-06-06 11:29
OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生

OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生

OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生

最近,OpenAI的一位前员工发表了一篇165页的超长博文,对AI发展的未来做出了一系列预测。文章的核心观点可以概括成一句话:人类很可能在2027年实现AGI。

来自主题: AI技术研报
8713 点击    2024-06-06 11:17
KAN会引起大模型的范式转变吗?

KAN会引起大模型的范式转变吗?

KAN会引起大模型的范式转变吗?

本文介绍了KAN网络算法的原理和优势,探讨了其在深度学习领域可能引发的范式转变。 • ⚡ KAN网络将可学习的激活函数从神经元移到了神经网络的边上,表现出更高的准确性和更少的参数量 • ???? KAN在数学和物理领域的实验中展现了卓越性能,提供了一种新的科学发现的路径 • ???? KAN具有更快的神经缩放定律和可解释性,为AI领域带来了新的探索可能性

来自主题: AI技术研报
9730 点击    2024-06-05 23:28
把整个地球装进神经网络,北航团队推出全球遥感图像生成模型

把整个地球装进神经网络,北航团队推出全球遥感图像生成模型

把整个地球装进神经网络,北航团队推出全球遥感图像生成模型

北航的研究团队,用扩散模型“复刻”了一个地球? 在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富多样的“平行场景”。 而且地形、气候、植被等复杂的地理特征,也全都考虑到了。

来自主题: AI技术研报
7482 点击    2024-06-05 23:18
腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题

腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题

腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题

过去十年间,基于随机梯度下降(SGD)的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中,Adam 及其变种最受追捧。无论是 SGD,还是 Adam,亦或是其他优化器,最核心的超参数非 Learning rate 莫属。因此如何调整好 Leanring rate 是炼丹师们从一开始就必学的技能。

来自主题: AI技术研报
7803 点击    2024-06-05 22:57
一个哪够?是时候让一群AI替你打工了

一个哪够?是时候让一群AI替你打工了

一个哪够?是时候让一群AI替你打工了

大模型的下一个突破方向是什么?斯坦福大学教授吴恩达的答案是AI智能体工作流。

来自主题: AI技术研报
9203 点击    2024-06-05 17:27
AI大模型正改变着推荐系统的未来

AI大模型正改变着推荐系统的未来

AI大模型正改变着推荐系统的未来

本文从技术角度介绍推荐系统发展,以及AI大模型在搜索推荐领域落地的前沿技术。

来自主题: AI技术研报
10092 点击    2024-06-05 10:28
单个4090可推理,2000亿稀疏大模型「天工MoE」开源

单个4090可推理,2000亿稀疏大模型「天工MoE」开源

单个4090可推理,2000亿稀疏大模型「天工MoE」开源

在大模型浪潮中,训练和部署最先进的密集 LLM 在计算需求和相关成本上带来了巨大挑战,尤其是在数百亿或数千亿参数的规模上。为了应对这些挑战,稀疏模型,如专家混合模型(MoE),已经变得越来越重要。这些模型通过将计算分配给各种专门的子模型或「专家」,提供了一种经济上更可行的替代方案,有可能以极低的资源需求达到甚至超过密集型模型的性能。

来自主题: AI技术研报
9172 点击    2024-06-04 17:59
Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集

Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集

Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知,对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说,构建高质量的网络规模数据集是非常重要的。然而,即使是最先进的开源 LLM 的预训练数据集也不公开,人们对其创建过程知之甚少。

来自主题: AI技术研报
9114 点击    2024-06-04 17:45