AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
最强开源大模型一夜易主

最强开源大模型一夜易主

最强开源大模型一夜易主

阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强。

来自主题: AI技术研报
9275 点击    2024-06-09 11:06
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法,用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!

来自主题: AI技术研报
9124 点击    2024-06-08 20:15
To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻觉

To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻觉

To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻觉

DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文,探讨了LLM的不确定性量化问题,通过「迭代提示」成功将LLM的认知不确定性和偶然不确定性解耦。研究还将新推导出的幻觉检测算法应用于Gemini,结果表明,与基线方法相比,该方法能有效检测幻觉。

来自主题: AI技术研报
9209 点击    2024-06-08 19:59
原作者带队,LSTM卷土重来之Vision-LSTM出世

原作者带队,LSTM卷土重来之Vision-LSTM出世

原作者带队,LSTM卷土重来之Vision-LSTM出世

与 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比,ViL 的性能更胜一筹。

来自主题: AI技术研报
8791 点击    2024-06-08 15:55
轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

检索增强生成 (RAG) 是将检索模型与生成模型结合起来,以提高生成内容的质量和相关性的一种有效的方法。RAG 的核心思想是利用大量文档或知识库来获取相关信息。各种工具支持 RAG,包括 Langchain 和 LlamaIndex。

来自主题: AI技术研报
10134 点击    2024-06-08 15:45
OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI研究如何破解GPT-4思维,公开超级对齐团队工作,Ilya Sutskever也在作者名单之列。

来自主题: AI技术研报
8698 点击    2024-06-08 12:07
OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

今天,OpenAI发布了一篇GPT-4可解释性的论文,似乎是作为前两天员工联名信的回应。网友细看论文才发现,这居然是已经解散的「超级对齐」团队的「最后之作」。

来自主题: AI技术研报
8749 点击    2024-06-08 11:50
全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了

全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了

全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了

一夜之间,全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世,火速杀进开源LLM排行榜第一,美国最强开源模型Llama3-70B直接被碾压!全球开发者粉丝狂欢:果然没白等。

来自主题: AI技术研报
9310 点击    2024-06-08 11:44
ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

不使用外部工具也能让大语言模型(LLMs)实现严谨可信的推理,新国立提出 SymbCoT 推理框架:结合符号化逻辑(Symbolic Logical)表达式与思维链,极大提升推理质量,鲁棒性与可信度。

来自主题: AI技术研报
9553 点击    2024-06-07 14:39
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

大模型也可解释了?大模型都在想什么?OpenAI 找到了一种办法,能给 GPT-4 做「扫描」,告诉你 AI 的思路,而且还把这种方法开源了。

来自主题: AI技术研报
9153 点击    2024-06-07 14:27
ICML 2024 Oral|外部引导的深度聚类新范式

ICML 2024 Oral|外部引导的深度聚类新范式

ICML 2024 Oral|外部引导的深度聚类新范式

怎样才能将可爱又迷人的柯基与柴犬的图像进行区分?

来自主题: AI技术研报
8592 点击    2024-06-07 10:56
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解决这一难题方面,一种强大的技术是根据人类反馈的强化学习(RLHF)。

来自主题: AI技术研报
9777 点击    2024-06-07 10:36
Cloudflare 宣布 AI Gateway 普遍可用

Cloudflare 宣布 AI Gateway 普遍可用

Cloudflare 宣布 AI Gateway 普遍可用

Cloudflare最近宣布AI Gateway已普遍可用。AI Gateway作为管理和扩展生成式AI工作负载的统一接口,让开发人员能够监控和控制AI应用程序。

来自主题: AI技术研报
9056 点击    2024-06-06 17:14
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升

首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升

首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升

CRATE-α是一种新型Transformer架构变体,通过设计改进提升了模型的可扩展性、性能和可解释性,CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型,其性能会随着模型和数据集规模扩大而继续提升。

来自主题: AI技术研报
9104 点击    2024-06-06 15:48
人类能否创造出有意识的AI?

人类能否创造出有意识的AI?

人类能否创造出有意识的AI?

随着近年来人工智能(AI)的惊人进步,AI 是否具有意识以及如何构建有意识的 AI 系统越来越受到学界和公众的关注。要回答这类问题,我们仍然需要或者必须从意识理论中去寻找灵感和答案。

来自主题: AI技术研报
8849 点击    2024-06-06 15:12
AI大模型会“读心”吗?

AI大模型会“读心”吗?

AI大模型会“读心”吗?

请想象这样一个场景。你坐在公交车上靠窗的位置,这时你的朋友突然对你说:“今天好像有点热”。你会怎么回应?大多数人的做法应该是立即打开窗户,因为他们巧妙地理解了朋友的言外之意:他是在礼貌地请求自己打开窗户,而不是单纯因为无聊而谈论天气。

来自主题: AI技术研报
8986 点击    2024-06-06 15:10
天大、南大发布LPSNet:无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天大、南大发布LPSNet:无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天大、南大发布LPSNet:无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天津大学与南京大学联合团队在CVPR 2024上发表了LPSNet项目,提出了一种端到端的无透镜成像下的3D人体姿态和形状估计框架,通过多尺度无透镜特征解码器和双头辅助监督机制,直接从编码后的无透镜成像数据中提取特征并提高姿态估计的准确度。

来自主题: AI技术研报
8954 点击    2024-06-06 11:29
OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生

OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生

OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生

最近,OpenAI的一位前员工发表了一篇165页的超长博文,对AI发展的未来做出了一系列预测。文章的核心观点可以概括成一句话:人类很可能在2027年实现AGI。

来自主题: AI技术研报
8703 点击    2024-06-06 11:17
KAN会引起大模型的范式转变吗?

KAN会引起大模型的范式转变吗?

KAN会引起大模型的范式转变吗?

本文介绍了KAN网络算法的原理和优势,探讨了其在深度学习领域可能引发的范式转变。 • ⚡ KAN网络将可学习的激活函数从神经元移到了神经网络的边上,表现出更高的准确性和更少的参数量 • ???? KAN在数学和物理领域的实验中展现了卓越性能,提供了一种新的科学发现的路径 • ???? KAN具有更快的神经缩放定律和可解释性,为AI领域带来了新的探索可能性

来自主题: AI技术研报
9692 点击    2024-06-05 23:28