AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
60行代码,从头开始构建GPT!最全实践指南来了

60行代码,从头开始构建GPT!最全实践指南来了

60行代码,从头开始构建GPT!最全实践指南来了

GPT早已成为大模型时代的基础。国外一位开发者发布了一篇实践指南,仅用60行代码构建GPT。

来自主题: AI技术研报
9081 点击    2024-03-01 17:44
首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

最近,OpenAI 视频生成模型 Sora 的爆火,给基于 Transformer 的扩散模型重新带来了一波热度,比如 Sora 研发负责人之一 William Peebles 与纽约大学助理教授谢赛宁去年提出的 DiT(Diffusion Transformer)。

来自主题: AI技术研报
3811 点击    2024-03-01 13:43
几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

本文提出了扩散模型中UNet的long skip connection的scaling操作可以有助于模型稳定训练的分析,目前已被NeurIPS 2023录用。同时,该分析还可以解释扩散模型中常用但未知原理的1/√2 scaling操作能加速训练的现象。

来自主题: AI技术研报
7673 点击    2024-02-29 13:52
微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

今天凌晨,由微软、国科大等机构提交的一篇论文在 AI 圈里被人们争相转阅。该研究提出了一种 1-bit 大模型,实现效果让人只想说两个字:震惊。

来自主题: AI技术研报
10373 点击    2024-02-29 13:42
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

根据 OpenAI 披露的技术报告,Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式,并通过 Transformer 和扩散模型结合,展现了卓越的扩展(scale)特性。

来自主题: AI技术研报
7222 点击    2024-02-29 13:35
微软6页论文爆火:三进制LLM,真香!

微软6页论文爆火:三进制LLM,真香!

微软6页论文爆火:三进制LLM,真香!

现在,大语言模型(LLM)迎来了“1-bit时代”。

来自主题: AI技术研报
3318 点击    2024-02-29 13:31
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法:它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。

来自主题: AI技术研报
9973 点击    2024-02-29 13:27
Sora和ChatGPT之后,教育怎么办?

Sora和ChatGPT之后,教育怎么办?

Sora和ChatGPT之后,教育怎么办?

用过ChatGPT的人知道,新时代来临了。Sora的出现,将人工智能推向新高潮。

来自主题: AI技术研报
7045 点击    2024-02-29 13:17
详解AI芯片参数,英伟达凭啥不能被替代?

详解AI芯片参数,英伟达凭啥不能被替代?

详解AI芯片参数,英伟达凭啥不能被替代?

2月22日,英伟达发布2024财年四季报,营收221亿美元,同比增长265%,净利润123亿美元,同比激增769%,双双大超市场预期。

来自主题: AI技术研报
9162 点击    2024-02-28 16:19
老黄祭出全新RTX 500 GPU,AIGC性能狂飙14倍!AI应用的门槛彻底被打下来了

老黄祭出全新RTX 500 GPU,AIGC性能狂飙14倍!AI应用的门槛彻底被打下来了

老黄祭出全新RTX 500 GPU,AIGC性能狂飙14倍!AI应用的门槛彻底被打下来了

英伟达发布移动工作站产品线最后一块拼图,号称与竞品相比效率提升14倍。随着今年大量AI消费级硬件的上市,AI应用的门槛彻底被老黄打下来了。

来自主题: AI技术研报
2258 点击    2024-02-28 15:56
MATRIX:社会模拟推动大模型价值自对齐,比GPT4更「体贴」

MATRIX:社会模拟推动大模型价值自对齐,比GPT4更「体贴」

MATRIX:社会模拟推动大模型价值自对齐,比GPT4更「体贴」

随着大语言模型(LLMs)在近年来取得显著进展,它们的能力日益增强,进而引发了一个关键的问题:如何确保他们与人类价值观对齐,从而避免潜在的社会负面影响?

来自主题: AI技术研报
9744 点击    2024-02-27 14:03
大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

大模型的成功很大程度上要归因于 Scaling Law 的存在,这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系,为模型开发、资源分配和选择合适的训练数据提供了宝贵的指导。

来自主题: AI技术研报
2934 点击    2024-02-27 14:00
刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

问世才两个星期,谷歌的世界模型也来了,能力看起来更强大:它生成的虚拟世界「自主可控」。

来自主题: AI技术研报
5691 点击    2024-02-26 18:34
国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

2023 年年底,很多人都预测,未来一年将是视频生成快速发展的一年。但出人意料的是,农历春节刚过,OpenAI 就扔出了一个重磅炸弹 —— 能生成 1 分钟流畅、逼真视频的 Sora。

来自主题: AI技术研报
7682 点击    2024-02-26 18:30
Sora·创世纪·大统一模型

Sora·创世纪·大统一模型

Sora·创世纪·大统一模型

无数人类天才穷尽一生才合伙建立残缺的大统一理论(GUT):它只统一了强相互作用、弱相互作用和电磁力,引力至今无法统一到模型之中。

来自主题: AI技术研报
8660 点击    2024-02-26 18:11
首席分析师揭秘爆火Groq,每小时要烧168美元!10倍H100拥有成本,老黄笑而不语

首席分析师揭秘爆火Groq,每小时要烧168美元!10倍H100拥有成本,老黄笑而不语

首席分析师揭秘爆火Groq,每小时要烧168美元!10倍H100拥有成本,老黄笑而不语

SemiAnalysis的行业专家对最近爆火的Groq推理系统进行了像素级的拆解,测算出其持有成本依然高达现有H100的10倍,看来要赶上老黄的步伐,初创公司还有很多要做。

来自主题: AI技术研报
5003 点击    2024-02-26 18:03
GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智

GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智

GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智

谷歌DeepMind最新研究发现,问题中前提条件的呈现顺序,对于大模型的推理性能有着决定性的影响,打乱顺序能让模型表现下降30%。

来自主题: AI技术研报
3533 点击    2024-02-26 17:56
提前300毫秒预测聚变中等离子体「撕裂」,普林斯顿团队AI控制器登上Nature

提前300毫秒预测聚变中等离子体「撕裂」,普林斯顿团队AI控制器登上Nature

提前300毫秒预测聚变中等离子体「撕裂」,普林斯顿团队AI控制器登上Nature

近日,普林斯顿大学和普林斯顿等离子体物理实验室研究核聚变能的科学家表示,他们已经找到了一种使用人工智能的方法,预测这些潜在不稳定性并实时阻止其发生。

来自主题: AI技术研报
7095 点击    2024-02-25 16:04
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。

来自主题: AI技术研报
3891 点击    2024-02-25 15:39