AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
这款国产免费编程工具火了!清华博士团队开发,响应延迟短、准确率高

这款国产免费编程工具火了!清华博士团队开发,响应延迟短、准确率高

这款国产免费编程工具火了!清华博士团队开发,响应延迟短、准确率高

非十科技推出了一款基于自研代码大模型打造的 AI 代码助手 ——Fitten Code,它可以帮助程序员更迅捷、更准确、更高质量地完成编码任务,大幅提升编码效率,并且向用户免费开放使用!

来自主题: AI技术研报
9943 点击    2024-01-30 13:56
大模型时代,南大周志华埋头做学件,最新论文上线

大模型时代,南大周志华埋头做学件,最新论文上线

大模型时代,南大周志华埋头做学件,最新论文上线

南京大学周志华教授提出的「学件」范式通过模型 + 规约的思路构建学件市场(现称学件基座系统),让用户根据需求从中统一地选择和部署模型。如今学件范式迎来了首个开源的基础平台 —— 北冥坞(Beimingwu)。

来自主题: AI技术研报
7383 点击    2024-01-30 13:51
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

删除权重矩阵的一些行和列,让 LLAMA-2 70B 的参数量减少 25%,模型还能保持 99% 的零样本任务性能,同时计算效率大大提升。这就是微软 SliceGPT 的威力。

来自主题: AI技术研报
3682 点击    2024-01-30 13:43
从零手搓MoE大模型,大神级教程来了

从零手搓MoE大模型,大神级教程来了

从零手搓MoE大模型,大神级教程来了

Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。

来自主题: AI技术研报
5593 点击    2024-01-29 16:30
AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码

AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码

AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码

一家名为GitClear的公司分析了近四年超过1.5亿行代码后发现,随着GitHub Copilot工具的加入,代码流失率(即代码写入后不久又被返工修改、删除的情况)出现了显著上升: 2023年为7.1%,而2020年时仅为3.3%,翻了一番。

来自主题: AI技术研报
9817 点击    2024-01-29 16:25
哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。

来自主题: AI技术研报
8471 点击    2024-01-29 12:45
Meta官方的Prompt工程指南:Llama 2这样用更高效

Meta官方的Prompt工程指南:Llama 2这样用更高效

Meta官方的Prompt工程指南:Llama 2这样用更高效

随着大型语言模型(LLM)技术日渐成熟,提示工程(Prompt Engineering)变得越来越重要。一些研究机构发布了 LLM 提示工程指南,包括微软、OpenAI 等等。

来自主题: AI技术研报
6593 点击    2024-01-29 12:36
王延峰:迫切需要重新审视我国大模型科研组织模式

王延峰:迫切需要重新审视我国大模型科研组织模式

王延峰:迫切需要重新审视我国大模型科研组织模式

ChatGPT 掀起的通用人工智能热潮仍在快速向前,产业竞争关键要素日渐明确,中美在通用人工智能领域的竞争也进入更高的战略层面。

来自主题: AI技术研报
4417 点击    2024-01-29 12:35
800万销量,过10亿收入,第一个陷入AI争议的爆款游戏出现了

800万销量,过10亿收入,第一个陷入AI争议的爆款游戏出现了

800万销量,过10亿收入,第一个陷入AI争议的爆款游戏出现了

这两天Steam上突然出现了一款爆火的现象级游戏《幻兽帕鲁(Palworld)》。发售没几天就直接冲到了Steam史上玩家在线排行榜第2,超过了CS2等一众经典老游戏。

来自主题: AI技术研报
5619 点击    2024-01-29 10:31
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目

更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目

更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目

近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。

来自主题: AI技术研报
6200 点击    2024-01-28 18:14
OpenAI新模型用的嵌入技术被网友扒出来了

OpenAI新模型用的嵌入技术被网友扒出来了

OpenAI新模型用的嵌入技术被网友扒出来了

前几天,OpenAI 来了一波重磅更新,一口气宣布了 5 个新模型,其中就包括两个新的文本嵌入模型。

来自主题: AI技术研报
6713 点击    2024-01-28 18:08
WebVoyager:借助强大多模态模型,开创全新的网络智能体 [译]

WebVoyager:借助强大多模态模型,开创全新的网络智能体 [译]

WebVoyager:借助强大多模态模型,开创全新的网络智能体 [译]

借助强大多模态模型,开创全新的网络智能体 Hongliang He1,3∗, Wenlin Yao2, Kaixin Ma2, Wenhao Yu2, Yong Dai2, Hongming Zhang2, Zhenzhong Lan3, Dong Yu2 1 浙江大学,2 腾讯 AI 实验室,3 西湖大学

来自主题: AI技术研报
9810 点击    2024-01-28 12:29
构建企业级 RAG 系统的高级指南 [译]

构建企业级 RAG 系统的高级指南 [译]

构建企业级 RAG 系统的高级指南 [译]

欢迎再次加入我们的“RAG 系统高级掌握”系列!我们将深入了解构建企业级 RAG (Retrieval-Augmented Generation) 系统的复杂世界。

来自主题: AI技术研报
12974 点击    2024-01-28 12:14
Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

融合多个异构大语言模型,中山大学、腾讯 AI Lab 推出 FuseLLM

来自主题: AI技术研报
4764 点击    2024-01-27 13:51
ChatGPT惊艳更新!一个@让三百万GPTs为你打工

ChatGPT惊艳更新!一个@让三百万GPTs为你打工

ChatGPT惊艳更新!一个@让三百万GPTs为你打工

ChatGPT悄悄更新个大功能!看起来要把插件系统迭代掉了。

来自主题: AI技术研报
4823 点击    2024-01-27 12:23
年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩

年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩

年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩

一款名为Vary-toy的“年轻人的第一个多模态大模型”来了!模型大小不到2B,消费级显卡可训练,GTX1080ti 8G的老显卡轻松运行。

来自主题: AI技术研报
3475 点击    2024-01-27 12:19
GPT-4不偷懒了!OpenAI连甩五个大模型,价格最低打两折

GPT-4不偷懒了!OpenAI连甩五个大模型,价格最低打两折

GPT-4不偷懒了!OpenAI连甩五个大模型,价格最低打两折

全新GPT-4 Turbo预览模型据介绍,该模型能更完整彻底地完成代码生成等任务,以减少模型未完成任务的“惰性”情况。

来自主题: AI技术研报
9706 点击    2024-01-27 10:47
大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述

大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述

大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述

本文介绍首个大模型时代下的文本水印综述,由清华、港中文、港科广、UIC、北邮联合发布,全面阐述了大模型时代下文本水印技术的算法类别与设计、评估角度与指标、实际应用场景,同时深入探讨了相关研究当前面临的挑战以及未来发展的方向,探索文本水印领域的前沿趋势。

来自主题: AI技术研报
4717 点击    2024-01-26 13:50
NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜

NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜

NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜

美国著名科技播客Latent Space对于刚刚过去的NeurIPS 2023上的精彩论文进行了一个全面的总结,回顾了多篇优秀论文,虽然没有获奖,但同样值得学界关注。

来自主题: AI技术研报
9955 点击    2024-01-26 13:40
「think step by step」还不够,让模型「think more steps」更有用

「think step by step」还不够,让模型「think more steps」更有用

「think step by step」还不够,让模型「think more steps」更有用

本文对思维链的推理步长进行了控制变量实验,发现推理步长和答案的准确性是线性相关的,这种影响机制甚至超越了问题本身所产生的差异。

来自主题: AI技术研报
2817 点击    2024-01-25 13:53
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型!首提时空架构,时长史诗级延长

拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型!首提时空架构,时长史诗级延长

拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型!首提时空架构,时长史诗级延长

爆肝7个月,谷歌祭出了AI视频大模型Lumiere,直接改变了游戏规则!全新架构让视频时长和一致性全面飞升,时长直接碾压Gen-2和Pika。

来自主题: AI技术研报
4870 点击    2024-01-25 13:17
小米新一代Kaldi团队论文解读:新型自动语音识别 (ASR) 模型Zipformer诞生之路|ICLR 2024 Oral

小米新一代Kaldi团队论文解读:新型自动语音识别 (ASR) 模型Zipformer诞生之路|ICLR 2024 Oral

小米新一代Kaldi团队论文解读:新型自动语音识别 (ASR) 模型Zipformer诞生之路|ICLR 2024 Oral

近日,小米集团新一代 Kaldi 团队关于语音识别声学模型的论文《Zipformer: A faster and better encoder for automatic speech recognition》被 ICLR 2024 接收为 Oral (Top 1.2%)。

来自主题: AI技术研报
4694 点击    2024-01-25 12:39
首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024

首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024

首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024

目标跟踪是计算机视觉的一项基础视觉任务,由于计算机视觉的快速发展,单模态 (RGB) 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性,我们需要引入多模态图像 (RGB、红外等) 来弥补这一缺陷,以实现复杂环境下全天候目标跟踪。

来自主题: AI技术研报
10039 点击    2024-01-24 14:10
大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一

大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一

大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一

去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,关于 Medusa 终于有了完整技术论文,还提供了新的版本。

来自主题: AI技术研报
4849 点击    2024-01-24 14:06