AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
没等来OpenAI,等来了Open-Sora全面开源

没等来OpenAI,等来了Open-Sora全面开源

没等来OpenAI,等来了Open-Sora全面开源

不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型 「Open-Sora 1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球 AI 热爱者共同推进视频创作的新纪元。

来自主题: AI技术研报
4244 点击    2024-03-18 17:25
Stability AI科学家Andreas Blattman:AI视频的挑战性在哪?

Stability AI科学家Andreas Blattman:AI视频的挑战性在哪?

Stability AI科学家Andreas Blattman:AI视频的挑战性在哪?

本文编译自播客节目a16z。Stability AI的科学家Andreas Blattmann和Robin Rombach与a16z的合伙人Anjney Midha共同探讨从文本到视频人工智能的前沿世界。

来自主题: AI技术研报
2900 点击    2024-03-18 17:21
为什么自从用上了AI,你的创造力不升反降了?

为什么自从用上了AI,你的创造力不升反降了?

为什么自从用上了AI,你的创造力不升反降了?

无论工具最初的建议看起来有多好,团队都应该跟进更多更具体的问题。

来自主题: AI技术研报
4648 点击    2024-03-18 16:49
马斯克开源Grok,好像也没有那么热血沸腾。

马斯克开源Grok,好像也没有那么热血沸腾。

马斯克开源Grok,好像也没有那么热血沸腾。

为了Musk的开源承诺,熬了个夜,结果是果然没让人失望。 我是喜爱Musk大于Altman的(比如咱们的logo等设计,均是跟Grok一样黑白风格),喜欢他的幽默,喜欢他的真性情,喜欢他的性狡黠而守义,尽管Grok并没有那么易用

来自主题: AI技术研报
5209 点击    2024-03-18 11:31
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim

COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim

COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim

哈工大联合度小满推出针对多模态模型的自适应剪枝算法 SmartTrim,论文已被自然语言处理顶级会议 COLING 24 接收。

来自主题: AI技术研报
4653 点击    2024-03-17 18:56
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

早在 2020 年,陶大程团队就发布了《Knowledge Distillation: A Survey》,详细介绍了知识蒸馏在深度学习中的应用,主要用于模型压缩和加速。随着大语言模型的出现,知识蒸馏的作用范围不断扩大,逐渐扩展到了用于提升小模型的性能以及模型的自我提升。

来自主题: AI技术研报
5192 点击    2024-03-16 15:28
流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?

流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?

流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?

谷歌 DeepMind 和美国 Janelia 研究园区(霍华德・休斯医学研究所成立的神经科学研究机构)共同研究出的一个虚拟果蝇,它能像真实的果蝇一样行走和飞行。

来自主题: AI技术研报
8008 点击    2024-03-16 15:22
何恺明刘壮新作:消除数据集偏差的十年之战

何恺明刘壮新作:消除数据集偏差的十年之战

何恺明刘壮新作:消除数据集偏差的十年之战

MIT新晋副教授何恺明,新作新鲜出炉:瞄准一个横亘在AI发展之路上十年之久的问题:数据集偏差。数据集偏差之战,在2011年由知名学者Antonio Torralba和Alyosha Efros提出——

来自主题: AI技术研报
4473 点击    2024-03-16 11:24
开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出「灵巧手」,泡茶剪纸炫技

开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出「灵巧手」,泡茶剪纸炫技

开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出「灵巧手」,泡茶剪纸炫技

「OpenAI机器人」一出世惊艳众人!最近,李飞飞团队打造了一个开源便携式手部动捕系统——DexCap,成本仅3600美元,就能让机械灵巧手完成花样任务。

来自主题: AI技术研报
5678 点击    2024-03-15 15:46
仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM

仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM

仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM

TimesFM针对时序数据设计,输出序列长于输入序列,在1000亿时间点数据进行预训练后,仅用200M参数量就展现出超强零样本学习能力!

来自主题: AI技术研报
4965 点击    2024-03-15 15:42
刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

StepCoder将长序列代码生成任务分解为代码完成子任务课程来缓解强化学习探索难题,对未执行的代码段以细粒度优化;还开源了可用于强化学习训练的APPS+数据集。

来自主题: AI技术研报
5768 点击    2024-03-15 15:38
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。

来自主题: AI技术研报
9777 点击    2024-03-15 15:24
Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

LLM开源从Infra做起!Meta公布了自己训练Llama 3的H100集群细节,看来Llama 3快来了。

来自主题: AI技术研报
4121 点击    2024-03-15 12:25
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力

LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力

LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力

数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在数学问题上表现出色。

来自主题: AI技术研报
8096 点击    2024-03-14 16:14
欧洲人工智能,尴尬与焦虑笼罩

欧洲人工智能,尴尬与焦虑笼罩

欧洲人工智能,尴尬与焦虑笼罩

ChatGPT横空出世的2023年,欧洲能喊得上名号的全球性AI峰会有近20个,大约是美国的3倍、中国的5倍[1]。在人工智能权威杂志(AI Magazine)年末总结的“2023 Top10 AI Events”中,欧洲承办的会议占比高达70%[2]。

来自主题: AI技术研报
6899 点击    2024-03-14 11:20
LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

新模型bGPT是一个基于字节的Transformer模型,能够将不同类型的数据纳入同一框架之下,可以生成文本、图像和音频,还能模拟计算机行为,数字世界将迎来真正的大一统?

来自主题: AI技术研报
10946 点击    2024-03-13 14:53
AI图片橡皮擦来了,清华&阿里合作推出「概念半透膜」模型,还能改头换面

AI图片橡皮擦来了,清华&阿里合作推出「概念半透膜」模型,还能改头换面

AI图片橡皮擦来了,清华&阿里合作推出「概念半透膜」模型,还能改头换面

第一步在常见 AI 作图模型输入「一只胖胖的像面包的橘猫」,画出一只长得很像面包的猫猫,然后用概念半透膜 SPM 技术,将猫猫这个概念擦掉,结果它就失去梦想变成了一只面包。上图 1 是更多的猫猫图失去猫这个概念后的结果。

来自主题: AI技术研报
5434 点击    2024-03-13 14:44
AI辅助发音:没有声带,人也能说话了

AI辅助发音:没有声带,人也能说话了

AI辅助发音:没有声带,人也能说话了

在人工智能(AI)的帮助下,一种新型柔性贴片,有望帮助部分嗓音障碍患者实现有效沟通。

来自主题: AI技术研报
8207 点击    2024-03-13 11:20
用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质|清华出品

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质|清华出品

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质|清华出品

随着大语言模型(LLM)的发展,很多研究发现LLM能够展现出稳定的人格特质,模仿人类细微的情绪与认知模式,还能辅助各种各样的社会科学仿真实验,为教育心理学、社会心理学、文化心理学、临床心理学、心理咨询等诸多心理学研究领域,提供了新的研究思路。

来自主题: AI技术研报
4075 点击    2024-03-13 11:15
350亿参数、开放权重,Transformer作者创业后推出新大模型

350亿参数、开放权重,Transformer作者创业后推出新大模型

350亿参数、开放权重,Transformer作者创业后推出新大模型

开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的 Cohere 公司推出的大模型 Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。

来自主题: AI技术研报
6118 点击    2024-03-12 18:54
被误解的「中文版Sora」背后,字节跳动有哪些技术?

被误解的「中文版Sora」背后,字节跳动有哪些技术?

被误解的「中文版Sora」背后,字节跳动有哪些技术?

2024 开年,OpenAI 就在生成式 AI 领域扔下了重磅炸弹:Sora。

来自主题: AI技术研报
4804 点击    2024-03-12 18:49
浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显

浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显

浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显

基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。

来自主题: AI技术研报
3444 点击    2024-03-12 18:13