AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型越大,性能越好?苹果自回归视觉模型AIM:没错

模型越大,性能越好?苹果自回归视觉模型AIM:没错

模型越大,性能越好?苹果自回归视觉模型AIM:没错

视觉模型,同样遵循「参数越多性能越强」的规律?刚刚,一项来自苹果公司的研究验证了这个猜想。

来自主题: AI技术研报
9582 点击    2024-01-18 18:19
GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星

GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星

GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星

Open Interpreter 允许LLM在您的计算机上运行代码来完成任务。这可能是人类使用电脑的新方式,一句人话,电脑开始帮人类完成任务。

来自主题: AI技术研报
4494 点击    2024-01-16 14:40
微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案

微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案

微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案

TaskWeaver 能够将用户的自然语言请求巧妙地转化为可执行代码,并支持丰富的数据结构、动态插件选择以及专业领域适应的规划过程。

来自主题: AI技术研报
3416 点击    2024-01-16 14:22
开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。

来自主题: AI技术研报
6958 点击    2024-01-16 14:18
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

SPF算法是一种基于状态序列频域预测的表征学习方法,利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息,从而辅助表征高效地提取到长期未来信息。

来自主题: AI技术研报
8593 点击    2024-01-16 10:59
Transformer的无限之路:位置编码视角下的长度外推综述

Transformer的无限之路:位置编码视角下的长度外推综述

Transformer的无限之路:位置编码视角下的长度外推综述

在自然语言处理(Natural Language Processing,NLP)领域,Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。

来自主题: AI技术研报
9013 点击    2024-01-16 10:13
Poe 获得 a16z 新一轮 7500 万美元融资,主要用于支付平台上的 Bot 创作者

Poe 获得 a16z 新一轮 7500 万美元融资,主要用于支付平台上的 Bot 创作者

Poe 获得 a16z 新一轮 7500 万美元融资,主要用于支付平台上的 Bot 创作者

刚刚,Quora CEO Adam D'Angelo 宣布 Quora 从 a16Z 获得 7500 万美元!Angelo 指出,他们希望通过这些目标来加速 AI 的主流应用,并为社会带来包括提高知识获取能力、民主化创意表达和加速经济增长在内的多种好处,这笔投资专门用于推动其 AI 聊天平台 Poe 的增长。

来自主题: AI技术研报
9461 点击    2024-01-10 18:51
单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

如何从一段视频中找出感兴趣的片段?时序行为检测(Temporal Action Localization,TAL)是一种常用方法。过去TAL中的建模是片段甚至实例级的,而现在只要视频里的一帧就能实现,效果媲美全监督。

来自主题: AI技术研报
7709 点击    2024-01-08 14:33
多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。

来自主题: AI技术研报
6666 点击    2024-01-08 14:02
LangChain - RAG: 做 RAG 的天选打工人,拿这几个指标找老板加薪!

LangChain - RAG: 做 RAG 的天选打工人,拿这几个指标找老板加薪!

LangChain - RAG: 做 RAG 的天选打工人,拿这几个指标找老板加薪!

做所有的工作之前,想好如何评估结果、制定好北极星指标至关重要!!! Ragas把 RAG 系统的评估指标拆分为三个维度如下,这可不是 Benz 的标...

来自主题: AI技术研报
8416 点击    2024-01-08 10:37
行业动态 | 2023年十大人工智能(LLM)必读论文

行业动态 | 2023年十大人工智能(LLM)必读论文

行业动态 | 2023年十大人工智能(LLM)必读论文

2023 年,是机器学习和人工智能发展最为迅速的一年,这里分享 10 篇最值得关注的论文。

来自主题: AI技术研报
8820 点击    2024-01-07 14:19
看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比 PS 大神抓着你的手助你 P 图。

来自主题: AI技术研报
3310 点击    2024-01-06 16:42
模型A:幸亏有你,我才不得0分,模型B:俺也一样

模型A:幸亏有你,我才不得0分,模型B:俺也一样

模型A:幸亏有你,我才不得0分,模型B:俺也一样

琳琅满目的乐高积木,通过一块又一块的叠加,可以创造出各种栩栩如生的人物、景观等,不同的乐高作品相互组合,又能为爱好者带来新的创意。

来自主题: AI技术研报
8779 点击    2024-01-06 16:37
大模型都会标注图像了,简单对话即可!来自清华&NUS

大模型都会标注图像了,简单对话即可!来自清华&NUS

大模型都会标注图像了,简单对话即可!来自清华&NUS

多模态大模型集成了检测分割模块后,抠图变得更简单了!

来自主题: AI技术研报
8527 点击    2024-01-04 10:43
ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

对于ChatGPT变笨原因,学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出:在训练数据截止之前的任务上,大模型表现明显更好。

来自主题: AI技术研报
4197 点击    2024-01-01 23:12
基础模型+机器人:现在已经走到哪一步了

基础模型+机器人:现在已经走到哪一步了

基础模型+机器人:现在已经走到哪一步了

机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。

来自主题: AI技术研报
4253 点击    2024-01-01 22:58
GPTs的出现,会使prompt engineering失去价值吗?

GPTs的出现,会使prompt engineering失去价值吗?

GPTs的出现,会使prompt engineering失去价值吗?

不会,prompt engineering 仍然是一个基本技能。GPTs 就是一个简化版的 Agent,这段提示词就是你能用来控制这个 Agent 最重要指令。

来自主题: AI技术研报
5348 点击    2024-01-01 11:52
告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

如果 AI 是一辆豪华跑车,那么 LoRA 微调技术就是让它加速的涡轮增压器。LoRA 强大到什么地步?它可以让模型的处理速度提升 300%。还记得 LCM-LoRA 的惊艳表现吗?其他模型的十步,它只需要一步就能达到相媲美的效果。

来自主题: AI技术研报
7658 点击    2024-01-01 11:14
8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

前段时间,Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区,其架构与 GPT-4 非常相似,很多人将其形容为 GPT-4 的「缩小版」。

来自主题: AI技术研报
5646 点击    2024-01-01 11:08
无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

一个来自MIT博士生的惊人发现:只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报
1695 点击    2023-12-31 12:01
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报
4137 点击    2023-12-30 15:16