AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

AIGC,算是狠狠地震荡了一把音乐圈。就在刚刚,OpenAI官方账号发布的一支由Sora制作的MV(Music Video)——《Worldweight》,引发了不少网友们的围观。

来自主题: AI技术研报
8402 点击    2024-04-03 13:52
究竟该指望谁来拉近我们与AI的距离?

究竟该指望谁来拉近我们与AI的距离?

究竟该指望谁来拉近我们与AI的距离?

AI被所有人使用的时代,正越来越近。如果说AI大模型之前已经用ChatGPT多轮的技术进展、国内的百模大战、Sora在视频大模型领域的突破,以及其他一系列大模型初步的应用探索证明了全新的AI更强大;那么最近悄然吹起的、厂商纷纷将最日常使用的消费电子终端套上AI之名的占位之风,则进一步宣告了AI普惠时代的加速到来。

来自主题: AI技术研报
9653 点击    2024-04-03 10:02
ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?

ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?

ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?

OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听到,谷歌搜索引擎这位巨人轰然倒地的巨响。

来自主题: AI技术研报
6892 点击    2024-04-02 16:40
黄学东分享:Zoom AI如何正确地「碾压GPT-4」

黄学东分享:Zoom AI如何正确地「碾压GPT-4」

黄学东分享:Zoom AI如何正确地「碾压GPT-4」

【新智元导读】Zoom AI通过独创的「联邦AI」的技术路线,联合多个大模型,在特定任务上超越GPT-4,体现出了多个大模型互帮互助的强大能力,而且成本也能控制在GPT-4一半的水品。

来自主题: AI技术研报
7830 点击    2024-04-02 16:05
英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

【新智元导读】老黄新GPU深夜炸场,超高规格的背后也付出了不小的代价,小编带大家深入了解一下新架构的硬件细节和成本,新显卡的售价究竟高不高?英伟达也不得不开始卷了

来自主题: AI技术研报
7266 点击    2024-04-02 15:54
阿里7B多模态文档理解大模型拿下新SOTA|开源

阿里7B多模态文档理解大模型拿下新SOTA|开源

阿里7B多模态文档理解大模型拿下新SOTA|开源

多模态文档理解能力新SOTA!阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。

来自主题: AI技术研报
7904 点击    2024-04-02 11:40
ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝,“这下闭环了”

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝,“这下闭环了”

ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝,“这下闭环了”

尴了个大尬! 人们还在嘲讽有人用ChatGPT写论文忘了删掉“狐狸尾巴”,另一边审稿人也被曝出用ChatGPT写同行评论了 。而且,还是来自ICLR、NeurIPS等顶会的那种。

来自主题: AI技术研报
6915 点击    2024-04-02 11:39
a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态

a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态

a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态

作为 Meta 的前 CTO,Quora CEO Adam D'Angelo 目前还是 OpenAI 的董事会成员,在 Quora 之外推出的 Poe,成为当下接入大模型最多的 Chatbot 平台:GPT-4、Claude3、Mistral 等模型都有,用户也可以在上面搭建自己的 Chatbot 机器人,如果有别的用户使用,还可以产生收益。

来自主题: AI技术研报
9555 点击    2024-04-02 10:05
今天起,ChatGPT无需注册就能用了

今天起,ChatGPT无需注册就能用了

今天起,ChatGPT无需注册就能用了

OpenAI狠狠地open了一把就在刚刚,OpenAI狠狠地open了一把:从今天起,ChatGPT打开即用,无需再注册帐号和登录了!

来自主题: AI技术研报
7679 点击    2024-04-02 09:53
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

随着生成模型(如 ChatGPT、扩散模型)飞速发展,一方面,生成数据质量越来越高,到了以假乱真的程度;另一方面,随着模型越来越大,也使得人类世界的真实数据即将枯竭。

来自主题: AI技术研报
11152 点击    2024-04-01 15:53
比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发展带来了巨大困难。面对这一挑战,原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2],带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩,将微调技术带进千家万户。

来自主题: AI技术研报
8942 点击    2024-04-01 15:45
可编辑的DALL·E 3要来了?一句话就能PS图片

可编辑的DALL·E 3要来了?一句话就能PS图片

可编辑的DALL·E 3要来了?一句话就能PS图片

OpenAI 从未放慢前进的脚步,DALL・E 3 将支持对生成后的图片进行再次编辑。

来自主题: AI技术研报
8100 点击    2024-04-01 15:29
AI行业买英伟达GPU,花的钱比赚的多17倍

AI行业买英伟达GPU,花的钱比赚的多17倍

AI行业买英伟达GPU,花的钱比赚的多17倍

搞 AI 大模型,实在太烧钱了。我们知道,如今的生成式 AI 有很大一部分是资本游戏,科技巨头利用自身强大的算力和数据占据领先位置,并正在使用先进 GPU 的并行算力将其推广落地。这么做的代价是什么?最近《华尔街日报》一篇有关明星创业公司的报道里给出了答案:投入是产出的 17 倍。

来自主题: AI技术研报
10138 点击    2024-04-01 15:22
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

CLIP长文本能力被解锁,图像检索任务表现显著提升!一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。

来自主题: AI技术研报
8984 点击    2024-04-01 11:26
恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真

恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真

恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真

【新智元导读】OpenAI机器人理解力虽强,却无法进行非语言交流。最近,哥伦比亚大学华人团队打造了全新的机器人Emo,不仅可以提前预测和模拟人类表情,还可以进行眼神交流。

来自主题: AI技术研报
8952 点击    2024-04-01 11:05
芯片战争早已打响!谷歌15个月打造首个TPU,欲和老黄平起平坐

芯片战争早已打响!谷歌15个月打造首个TPU,欲和老黄平起平坐

芯片战争早已打响!谷歌15个月打造首个TPU,欲和老黄平起平坐

【新智元导读】在英伟达统治AI时代硬件的当下,谷歌的TPU却开辟了另一条道路。今天,小编带你了解第一块TPU的前世今生,同时揭开TPU架构的神秘面纱。

来自主题: AI技术研报
8672 点击    2024-04-01 10:10
CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练一个 243 帧的 VPT 模型通常需要花费好几天的时间,严重拖慢了研究的进度,并成为了该领域亟待解决的一大痛点。

来自主题: AI技术研报
7713 点击    2024-03-31 14:44
OpenAI藏了1年多的技术正式公开!15秒素材克隆声音,HeyGen也在用

OpenAI藏了1年多的技术正式公开!15秒素材克隆声音,HeyGen也在用

OpenAI藏了1年多的技术正式公开!15秒素材克隆声音,HeyGen也在用

OpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。 有了它,只需15秒的语音样本,就能克隆出一个人的声音,而且还能跨越语言! APP版ChatGPT中的语音对话功能,也正是由这项技术所驱动。

来自主题: AI技术研报
8025 点击    2024-03-31 14:12
吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果

吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果

吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果

AI 智能体是去年很火的一个话题,但是 AI 智能体到底有多大的潜力,很多人可能没有概念。 最近,斯坦福大学教授吴恩达在演讲中提到,他们发现,基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然,基于 GPT-4 构建的智能体工作流效果更好。由此看来,AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。这是一个值得所有人关注的趋势。

来自主题: AI技术研报
7908 点击    2024-03-31 13:54
Suno证明了当Rapper是真没门槛|AI 鲜测

Suno证明了当Rapper是真没门槛|AI 鲜测

Suno证明了当Rapper是真没门槛|AI 鲜测

对于普通人来说,写一首歌是一件难事: 作词、作曲、编曲、录制这套流程下来,不仅要有乐理知识,也要对各个乐器的理解度,而且对于设备的要求也很高。

来自主题: AI技术研报
6778 点击    2024-03-31 12:59
《妈妈咪呀》国际女星一夜被AI端掉饭碗!

《妈妈咪呀》国际女星一夜被AI端掉饭碗!

《妈妈咪呀》国际女星一夜被AI端掉饭碗!

【新智元导读】AI淘汰人类的紧迫感越来越近了!最近,在音乐剧《妈妈咪呀》饰演主角女星,被一封BBC邮件告知:不用来了,AI替代了你。

来自主题: AI技术研报
7739 点击    2024-03-30 14:54
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

【新智元导读】大模型的幻觉问题怎么解?谷歌DeepMind:用AI来做同行评审!事实核验正确率超过人类,而且便宜20倍。

来自主题: AI技术研报
7684 点击    2024-03-30 14:45
1000亿美元宇宙级豪赌!微软OpenAI打造星际之门AI超算,电力能耗惊人

1000亿美元宇宙级豪赌!微软OpenAI打造星际之门AI超算,电力能耗惊人

1000亿美元宇宙级豪赌!微软OpenAI打造星际之门AI超算,电力能耗惊人

【新智元导读】炸裂消息!据外媒透露,微软和OpenAI正豪掷超千亿美元,欲打造一台「星际之门」超算。最快在2028年,「星际之门」就要启动了。而它对电力的需求,将达到前所未有的程度。

来自主题: AI技术研报
7902 点击    2024-03-30 14:33
Mamba架构第一次做大!混合Transformer,打败Transformer

Mamba架构第一次做大!混合Transformer,打败Transformer

Mamba架构第一次做大!混合Transformer,打败Transformer

精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数,还是Mamba+Transformer混合架构。 它的名字叫Jamba。

来自主题: AI技术研报
6795 点击    2024-03-30 14:01