AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI Agents 现状报告,未来可期 or 强弩之末?

AI Agents 现状报告,未来可期 or 强弩之末?

AI Agents 现状报告,未来可期 or 强弩之末?

LangChain 最近调查了 1,300 多名专业人士——从工程师和产品经理到企业领导者和高管——以揭示 AI Agents 的现状。

来自主题: AI技术研报
7879 点击    2024-11-25 10:05
17 种 prompt engineering 方法大集合

17 种 prompt engineering 方法大集合

17 种 prompt engineering 方法大集合

本文主要介绍prompt engineering的多种方法

来自主题: AI技术研报
8141 点击    2024-11-25 10:05
震撼!苏黎世联邦理工和DeepMind发现LLM存在"盲从效应",这可能颠覆我们对AI的认知 |COLM 2024

震撼!苏黎世联邦理工和DeepMind发现LLM存在"盲从效应",这可能颠覆我们对AI的认知 |COLM 2024

震撼!苏黎世联邦理工和DeepMind发现LLM存在"盲从效应",这可能颠覆我们对AI的认知 |COLM 2024

在当今人工智能迅猛发展的时代,大语言模型(LLMs)已成为众多AI应用的核心引擎。然而,来自ETH Zurich和Google DeepMind的一项最新研究揭示了一个令人深思的现象:这些看似强大的模型存在着严重的“盲从效应”。

来自主题: AI技术研报
6389 点击    2024-11-25 09:44
Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。

来自主题: AI技术研报
6825 点击    2024-11-24 21:22
Nature:谷歌学术正在被AI工具颠覆

Nature:谷歌学术正在被AI工具颠覆

Nature:谷歌学术正在被AI工具颠覆

曾经每天都用谷歌学术的科学家们,正在转向新的AI工具。

来自主题: AI技术研报
5945 点击    2024-11-24 20:43
扩散模型=进化算法!生物学大佬用数学揭示本质

扩散模型=进化算法!生物学大佬用数学揭示本质

扩散模型=进化算法!生物学大佬用数学揭示本质

扩散模型的本质竟是进化算法!生物学大佬从数学的角度证实了这个结论,并结合扩散模型创建了全新的进化算法。

来自主题: AI技术研报
6587 点击    2024-11-24 20:26
研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

我们对小型语言模型的增强方法、已存在的小模型、应用、与 LLMs 的协作、以及可信赖性方面进行了详细调查。

来自主题: AI技术研报
7054 点击    2024-11-24 20:02
智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间

智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间

智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间

在机器学习领域,开发一个在未见过领域表现出色的通用智能体一直是长期目标之一。一种观点认为,在大量离线文本和视频数据上训练的大型 transformer 最终可以实现这一目标。

来自主题: AI技术研报
6196 点击    2024-11-24 19:59
这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct

这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct

这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct

开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。

来自主题: AI技术研报
11749 点击    2024-11-23 16:04
全球十亿级轨迹点驱动,首个轨迹基础大模型来了

全球十亿级轨迹点驱动,首个轨迹基础大模型来了

全球十亿级轨迹点驱动,首个轨迹基础大模型来了

在智慧城市和大数据时代背景下,人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题,限制了模型的泛化能力和实际应用范围。

来自主题: AI技术研报
9786 点击    2024-11-22 17:21
大模型不会推理,为什么也能有思路?有人把原理搞明白了

大模型不会推理,为什么也能有思路?有人把原理搞明白了

大模型不会推理,为什么也能有思路?有人把原理搞明白了

大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。

来自主题: AI技术研报
8116 点击    2024-11-22 16:53
上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

自从 OpenAI 发布展现出前所未有复杂推理能力的 o1 系列模型以来,全球掀起了一场 AI 能力 “复现” 竞赛。近日,上海交通大学 GAIR 研究团队在 o1 模型复现过程中取得新的突破,通过简单的知识蒸馏方法,团队成功使基础模型在数学推理能力上超越 o1-preview。

来自主题: AI技术研报
6729 点击    2024-11-22 16:46
DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

在多模态AI领域,基于预训练视觉编码器与MLLM的方法(如LLaVA系列)在视觉理解任务上展现出卓越性能。

来自主题: AI技术研报
9437 点击    2024-11-22 15:54
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。

来自主题: AI技术研报
7306 点击    2024-11-22 14:41
机器人训练数据不缺了!英伟达团队推出DexMG:数据增强200倍

机器人训练数据不缺了!英伟达团队推出DexMG:数据增强200倍

机器人训练数据不缺了!英伟达团队推出DexMG:数据增强200倍

最近,Jim Fan参与的一项研究推出了自动化数据生成系统DexMimicGen。该系统可基于少量人类演示,合成类人机器人的灵巧手运动轨迹,解决了训练数据集的获取难题,而且还提升了实验中机器人的表现。

来自主题: AI技术研报
7176 点击    2024-11-22 14:33
续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作

续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作

续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作

Scaling Law撞墙,扩展语言智能体的推理时计算实在太难了!破局之道,竟是使用LLM作为世界模型?OSU华人团队发现,使用GPT-4o作为世界模型来支持复杂环境中的规划,潜力巨大。

来自主题: AI技术研报
6523 点击    2024-11-22 13:38
“AI赋能硬件:亲手打造孩子专属的智能玩具”

“AI赋能硬件:亲手打造孩子专属的智能玩具”

“AI赋能硬件:亲手打造孩子专属的智能玩具”

千帆社区开发者黄定骅现身解读参加「千帆AppBuilder-智能硬件AIOT创意赛第一期」的心路历程。

来自主题: AI技术研报
9084 点击    2024-11-22 10:50
速递|瞄准 toB Agent!法国 AI 独角兽 H 推出首款产品 Runner H,专注企业自动化与定制化场景

速递|瞄准 toB Agent!法国 AI 独角兽 H 推出首款产品 Runner H,专注企业自动化与定制化场景

速递|瞄准 toB Agent!法国 AI 独角兽 H 推出首款产品 Runner H,专注企业自动化与定制化场景

去年夏天,法国 AI 初创公司 H 在尚未发布任何产品的情况下,宣布完成了惊人的 2.2 亿美元种子轮融资,引发行业轰动。

来自主题: AI技术研报
9021 点击    2024-11-22 10:41
人机协作AI提升在线心理健康支持的同理心对话

人机协作AI提升在线心理健康支持的同理心对话

人机协作AI提升在线心理健康支持的同理心对话

研究问题:这篇文章研究了如何在基于文本的在线同伴支持平台中,通过人工智能(AI)与人类协作,提高同伴之间的同理心对话质量。

来自主题: AI技术研报
10444 点击    2024-11-22 10:33
NeurIPS 2024 | 水印与高效推理如何两全其美?最新理论:这做不到

NeurIPS 2024 | 水印与高效推理如何两全其美?最新理论:这做不到

NeurIPS 2024 | 水印与高效推理如何两全其美?最新理论:这做不到

近日,DeepMind 团队将水印技术和投机采样(speculative sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。

来自主题: AI技术研报
7427 点击    2024-11-22 10:14
诺奖得主哈萨比斯新作登Nature,AlphaQubit解码出更可靠量子计算机

诺奖得主哈萨比斯新作登Nature,AlphaQubit解码出更可靠量子计算机

诺奖得主哈萨比斯新作登Nature,AlphaQubit解码出更可靠量子计算机

今天凌晨,新晋诺贝尔化学奖得主、DeepMind 创始人哈萨比斯参与撰写的新论文登上了 Nature,主题是如何更准确地识别并纠正量子计算机内部的错误。

来自主题: AI技术研报
7144 点击    2024-11-22 10:07
想象未来AI,科幻可以做些什么?

想象未来AI,科幻可以做些什么?

想象未来AI,科幻可以做些什么?

科幻影响AI想象与现实发展,揭示人类需求。

来自主题: AI技术研报
5626 点击    2024-11-22 09:49
手把手教你预训练一个小型 LLM|Steel-LLM 的实战经验

手把手教你预训练一个小型 LLM|Steel-LLM 的实战经验

手把手教你预训练一个小型 LLM|Steel-LLM 的实战经验

随着开源数据的日益丰富以及算力价格的持续下降,对于个人或小型机构而言,预训练一个小型的 LLM 已逐渐成为可能。开源中文预训练语言模型 Steel - LLM 就是一个典型案例,其模型参数量与数据量并非十分庞大,基本处于参数量为 B 级别、数据量为 T 级别的规模。

来自主题: AI技术研报
8333 点击    2024-11-22 09:44