AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报
6299 点击    2024-05-12 15:49
70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

大模型回答如何更可靠?MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,击败了LLaMA-65B,甚至与PaLM-540B相媲美。

来自主题: AI技术研报
8036 点击    2024-05-12 15:19
国产大模型:今天起,我们100万tokens只需1元!

国产大模型:今天起,我们100万tokens只需1元!

国产大模型:今天起,我们100万tokens只需1元!

昨天刚刚在顶会ICLR作为特邀演讲(Invited Talk)中“国内唯一”的大模型玩家智谱AI,今天又放出了一个好消息

来自主题: AI技术研报
8724 点击    2024-05-12 12:35
人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈

人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈

人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈

Richard Sutton 在 「The Bitter Lesson」中做过这样的评价:「从70年的人工智能研究中可以得出的最重要教训是,那些利用计算的通用方法最终是最有效的,而且优势巨大。」

来自主题: AI技术研报
6059 点击    2024-05-12 11:26
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程

KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程

KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程

刚刚提出了KAN的MIT物理学家Max Tegmark和北大校友刘子鸣,又有一项重磅研究问世了!团队发现,它们用AI发现了物理学中的新方程,从此,AI很可能被引入物理学研究领域,帮助人类物理学家做出全新的发现。

来自主题: AI技术研报
7801 点击    2024-05-11 16:04
抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门,成为了Hacker News等许多科技媒体的头版头条。

来自主题: AI技术研报
3582 点击    2024-05-11 13:06
绿了算力,红了AI

绿了算力,红了AI

绿了算力,红了AI

有数据统计,2022年全年,全国数据中心耗电量达到2700亿千瓦时,占全社会用电量约3%。预计2024年全国数据中心的耗电量将在3400亿至3600亿度之间,到2025年可能增长至4000亿至4400亿度。

来自主题: AI技术研报
6334 点击    2024-05-11 11:11
与AI共舞,RISC-V芯片加速落地生根

与AI共舞,RISC-V芯片加速落地生根

与AI共舞,RISC-V芯片加速落地生根

自计算机诞生以来,指令集架构一直是计算机体系结构中的核心概念之一。目前市场上主流的指令集架构两大巨头是x86和ARM,前者基本垄断了PC、笔记本电脑和服务器领域,后者则在智能手机和移动终端市场占据主导地位。

来自主题: AI技术研报
5365 点击    2024-05-11 11:08
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)已经在文本和图像等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。

来自主题: AI技术研报
8252 点击    2024-05-10 23:32
苹果启动AI云服务器计划,芯片直接用M2 Ultra

苹果启动AI云服务器计划,芯片直接用M2 Ultra

苹果启动AI云服务器计划,芯片直接用M2 Ultra

尽管苹果在生成式 AI 方面的进展没有像谷歌、Meta 和微软等竞争对手那样高调,但该公司一直在进行相关研究,其构筑新生态的思路总是显得与众不同。

来自主题: AI技术研报
11178 点击    2024-05-10 23:24
在ICLR 2024这场演讲中,智谱AI首次公开神秘项目「GLM-zero」

在ICLR 2024这场演讲中,智谱AI首次公开神秘项目「GLM-zero」

在ICLR 2024这场演讲中,智谱AI首次公开神秘项目「GLM-zero」

在机器学习社区中,ICLR (国际学习表征会议)是较为「年轻」的学术会议,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 在 2013 年牵头举办。但 ICLR 很快就获得了研究者的广泛认可,并且在 AI 圈拥有了深度学习会议「无冕之王」的称号。

来自主题: AI技术研报
9554 点击    2024-05-10 23:22
AI顶会ICLR,今年只有一家中国大模型公司受邀演讲

AI顶会ICLR,今年只有一家中国大模型公司受邀演讲

AI顶会ICLR,今年只有一家中国大模型公司受邀演讲

机器学习三大顶会之一的ICLR 2024,正在维也纳如火如荼地举行。

来自主题: AI技术研报
8788 点击    2024-05-10 23:08
复旦大学AI³徐盈辉研究员:Agent的可视化创作界面 ——Agent Insights

复旦大学AI³徐盈辉研究员:Agent的可视化创作界面 ——Agent Insights

复旦大学AI³徐盈辉研究员:Agent的可视化创作界面 ——Agent Insights

传统 LLM-based AI Agent 运维平台在复杂应用开发方面存在一定局限 ,复旦大学人工智能创新与产业研究院(AI³)徐盈辉研究员与 AI2Apps 团队打造的 AI2Apps 可视化集成开发环境集成了工程级的开发工具,覆盖 AI Agent 完整开发周期,具有完全开放的扩展性,并自带浏览器沙盒环境,借鉴 Figma 的理念

来自主题: AI技术研报
6921 点击    2024-05-10 17:25
2024年「AIGC发展趋势」报告

2024年「AIGC发展趋势」报告

2024年「AIGC发展趋势」报告

近年来,在经历了ChatGPT、Midjourney等国际AIGC产品的飞速发展,以及百度文心、阿里通义、Kimi等国内AIGC产品的激烈追赶后,2024年,几乎每位互联网用户都或多或少接触了AIGC技术产生的内容。从智能手机中的大模型助手,到日常所见的AI生成图片,再到职场中的AIGC工具辅助优化工作,AIGC内容已遍布人们的生活中。

来自主题: AI技术研报
8368 点击    2024-05-10 16:59
谷歌CEO最新访谈:AI浪潮仍处于早期阶段,公司未来最大威胁是执行力不足

谷歌CEO最新访谈:AI浪潮仍处于早期阶段,公司未来最大威胁是执行力不足

谷歌CEO最新访谈:AI浪潮仍处于早期阶段,公司未来最大威胁是执行力不足

腾讯科技讯 作为搜索领域无可争议的霸主,谷歌改变了我们生活的方方面面,从日常琐事到工作事务,再到我们的沟通方式。多年来,谷歌一直是互联网的窗口,为我们提供大量知识和信息,但如今,随着其他类似平台的崛起,谷歌可能不再是我们寻找答案的首要选择。那么,面对这样的挑战,谷歌又将如何应对?

来自主题: AI技术研报
6760 点击    2024-05-10 16:49
AI接近成为神?谷歌AlphaFold 3直接预测生命过程

AI接近成为神?谷歌AlphaFold 3直接预测生命过程

AI接近成为神?谷歌AlphaFold 3直接预测生命过程

当人们还在呼唤GPT-5、辗转于各种聊天机器人争夺战时,Google已经把人工智能模型与现实世界的距离又拉近了一大步。

来自主题: AI技术研报
1289 点击    2024-05-10 16:40
AI创业一年,连电费都没赚回来

AI创业一年,连电费都没赚回来

AI创业一年,连电费都没赚回来

“逐梦AI圈”的中小创业者,何时圆梦?

来自主题: AI技术研报
9587 点击    2024-05-10 10:52