AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

3 月 23 日,国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品。阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版。

来自主题: AI技术研报
8573 点击    2024-03-25 12:48
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

自理海大学、微软研究院的研究者提出了一种多智能体框架 Mora,该框架整合了几种先进的视觉 AI 智能体,以复制 Sora 所展示的通用视频生成能力。

来自主题: AI技术研报
4578 点击    2024-03-23 21:22
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。

来自主题: AI技术研报
9715 点击    2024-03-21 18:35
3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

受人类视觉系统的启发,MVDiffusion++结合计算方法高保真和人类视觉系统灵活性,可以根据任意数量的无位姿图片, 生成密集、高分辨率的有位姿图像,实现了高质量的3D模型重建。

来自主题: AI技术研报
7223 点击    2024-03-21 10:24
Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

近日,Stability AI又发布了新作SV3D,基于视频扩散模型的SV3D将3D模型生成的效果提升了一大截,模型权重已在huggingface开放。

来自主题: AI技术研报
4145 点击    2024-03-21 10:20
微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工

微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工

微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工

成立2年,估值40亿美元AI初创公司,被微软一夜吞噬。今天,Inflection两位联创官宣加入微软成立的新部门Microsoft AI,分别担任负责人和首席科学家。网友纷纷表示微软仅通过「雇佣」就把Inflection「收购了」。

来自主题: AI技术研报
7666 点击    2024-03-21 10:06
Kimi.ai与ChatGPT:长文本理解与科研辅助的比较研究

Kimi.ai与ChatGPT:长文本理解与科研辅助的比较研究

Kimi.ai与ChatGPT:长文本理解与科研辅助的比较研究

一直以来,我都习惯于用各种各样的外部工具辅助自己的科研全过程。从论文阅读、文献查找、公式理解,再到论文润色,AI工具都能在不同程度地帮上我。

来自主题: AI技术研报
7564 点击    2024-03-21 09:40
旷视实战大模型:把多模态扎进行业

旷视实战大模型:把多模态扎进行业

旷视实战大模型:把多模态扎进行业

距离ChatGPT、GPT-4等引爆新一轮人工智能变革的时刻,已经过去了整整一年的时间。在这一年里,国内外大量公司涌入大模型的“斗兽场”,加速大模型技术的迭代与跃迁。

来自主题: AI技术研报
8122 点击    2024-03-20 16:24
如何从头开始编写LoRA代码,这有一份教程

如何从头开始编写LoRA代码,这有一份教程

如何从头开始编写LoRA代码,这有一份教程

作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。

来自主题: AI技术研报
7100 点击    2024-03-20 16:16
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

3D 生成领域迎来新的「SOTA 级选手」,支持商用和非商用。Stability AI 的大模型家族来了一位新成员。昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Video 3D」(简称 SV3D)。

来自主题: AI技术研报
6699 点击    2024-03-20 16:10
锚定智算引擎,联想首台国产AI服务器在安徽合肥交付 | 新氪度

锚定智算引擎,联想首台国产AI服务器在安徽合肥交付 | 新氪度

锚定智算引擎,联想首台国产AI服务器在安徽合肥交付 | 新氪度

国产化不再是一个简单的口号,而是落实在具象产品之中。3月19日,36氪安徽从联宝(合肥)电子科技有限公司(简称“联宝科技”)获悉,联想首台可搭载国产AI算力芯片的联想问天WA5480 G3服务器在合肥成功交付。

来自主题: AI技术研报
3939 点击    2024-03-20 11:23
百万token上下文窗口也杀不死向量数据库?CPU笑了

百万token上下文窗口也杀不死向量数据库?CPU笑了

百万token上下文窗口也杀不死向量数据库?CPU笑了

“Claude 3、Gemini 1.5,是要把RAG(检索增强生成)给搞死了吗?”

来自主题: AI技术研报
3149 点击    2024-03-19 17:44
如何从零开始训练大模型(minicpm分享&讨论)

如何从零开始训练大模型(minicpm分享&讨论)

如何从零开始训练大模型(minicpm分享&讨论)

根据scaling law,模型越大,高质量数据越多,效果越好。 但还有一个很直观的情况,随着预训练样本的质量不断提升,训练手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。

来自主题: AI技术研报
2924 点击    2024-03-19 15:55
想玩AI?先问问这家电力巨头

想玩AI?先问问这家电力巨头

想玩AI?先问问这家电力巨头

人工智能大模型的高耗电,会让很多国家玩不起。

来自主题: AI技术研报
2311 点击    2024-03-19 13:14
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」

可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」

可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」

【新智元导读】利用文本生成图片(Text-to-Image, T2I)已经满足不了人们的需要了,近期研究在T2I模型的基础上引入了更多类型的条件来生成图像,本文对这些方法进行了总结综述。

来自主题: AI技术研报
2747 点击    2024-03-19 11:44
ICLR 2024 | 连续学习不怕丢西瓜捡芝麻,神经形态方法保护旧知识

ICLR 2024 | 连续学习不怕丢西瓜捡芝麻,神经形态方法保护旧知识

ICLR 2024 | 连续学习不怕丢西瓜捡芝麻,神经形态方法保护旧知识

以脉冲神经网络(SNN)为代表的脑启发神经形态计算(neuromorphic computing)由于计算上的节能性质在最近几年受到了越来越多的关注 [1]。受启发于人脑中的生物神经元,神经形态计算通过模拟并行的存内计算、基于脉冲信号的事件驱动计算等生物特性,能够在不同于冯诺依曼架构的神经形态芯片上以低功耗实现神经网络计算。

来自主题: AI技术研报
3649 点击    2024-03-19 10:27
如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

深度学习模型因其能够从大量数据中学习潜在关系的能力而「彻底改变了科学研究领域」。然而,纯粹依赖数据驱动的模型逐渐暴露出其局限性,如过度依赖数据、泛化能力受限以及与物理现实的一致性问题。

来自主题: AI技术研报
7943 点击    2024-03-18 20:24
ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍

ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍

ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍

Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用,扫清了实际应用的障碍!

来自主题: AI技术研报
3252 点击    2024-03-18 19:58
没等来OpenAI,等来了Open-Sora全面开源

没等来OpenAI,等来了Open-Sora全面开源

没等来OpenAI,等来了Open-Sora全面开源

不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型 「Open-Sora 1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球 AI 热爱者共同推进视频创作的新纪元。

来自主题: AI技术研报
4233 点击    2024-03-18 17:25
Stability AI科学家Andreas Blattman:AI视频的挑战性在哪?

Stability AI科学家Andreas Blattman:AI视频的挑战性在哪?

Stability AI科学家Andreas Blattman:AI视频的挑战性在哪?

本文编译自播客节目a16z。Stability AI的科学家Andreas Blattmann和Robin Rombach与a16z的合伙人Anjney Midha共同探讨从文本到视频人工智能的前沿世界。

来自主题: AI技术研报
2886 点击    2024-03-18 17:21
为什么自从用上了AI,你的创造力不升反降了?

为什么自从用上了AI,你的创造力不升反降了?

为什么自从用上了AI,你的创造力不升反降了?

无论工具最初的建议看起来有多好,团队都应该跟进更多更具体的问题。

来自主题: AI技术研报
4647 点击    2024-03-18 16:49
马斯克开源Grok,好像也没有那么热血沸腾。

马斯克开源Grok,好像也没有那么热血沸腾。

马斯克开源Grok,好像也没有那么热血沸腾。

为了Musk的开源承诺,熬了个夜,结果是果然没让人失望。 我是喜爱Musk大于Altman的(比如咱们的logo等设计,均是跟Grok一样黑白风格),喜欢他的幽默,喜欢他的真性情,喜欢他的性狡黠而守义,尽管Grok并没有那么易用

来自主题: AI技术研报
5198 点击    2024-03-18 11:31
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim

COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim

COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim

哈工大联合度小满推出针对多模态模型的自适应剪枝算法 SmartTrim,论文已被自然语言处理顶级会议 COLING 24 接收。

来自主题: AI技术研报
4648 点击    2024-03-17 18:56
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

早在 2020 年,陶大程团队就发布了《Knowledge Distillation: A Survey》,详细介绍了知识蒸馏在深度学习中的应用,主要用于模型压缩和加速。随着大语言模型的出现,知识蒸馏的作用范围不断扩大,逐渐扩展到了用于提升小模型的性能以及模型的自我提升。

来自主题: AI技术研报
5188 点击    2024-03-16 15:28
流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?

流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?

流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?

谷歌 DeepMind 和美国 Janelia 研究园区(霍华德・休斯医学研究所成立的神经科学研究机构)共同研究出的一个虚拟果蝇,它能像真实的果蝇一样行走和飞行。

来自主题: AI技术研报
8007 点击    2024-03-16 15:22