AI技术研报-这里有最前沿的人工智能技术解读

刚刚，Sora官方发布首支MV

AIGC，算是狠狠地震荡了一把音乐圈。就在刚刚，OpenAI官方账号发布的一支由Sora制作的MV（Music Video）——《Worldweight》，引发了不少网友们的围观。

来自主题: AI技术研报

8402 点击 2024-04-03 13:52

究竟该指望谁来拉近我们与AI的距离？

AI被所有人使用的时代，正越来越近。如果说AI大模型之前已经用ChatGPT多轮的技术进展、国内的百模大战、Sora在视频大模型领域的突破，以及其他一系列大模型初步的应用探索证明了全新的AI更强大；那么最近悄然吹起的、厂商纷纷将最日常使用的消费电子终端套上AI之名的占位之风，则进一步宣告了AI普惠时代的加速到来。

来自主题: AI技术研报

9653 点击 2024-04-03 10:02

扩散模型攻克算法难题，AGI不远了！谷歌大脑找到迷宫最短路径

解决最短路径算法，也能被扩散模型完成。

来自主题: AI技术研报

5554 点击 2024-04-02 17:18

ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

OpenAI这份愚人节礼物，实在是太大了：今天起，ChatGPT不用注册，可以直接使用。用户狂欢，竞品颤抖，我们仿佛已经听到，谷歌搜索引擎这位巨人轰然倒地的巨响。

来自主题: AI技术研报

6892 点击 2024-04-02 16:40

黄学东分享：Zoom AI如何正确地「碾压GPT-4」

【新智元导读】Zoom AI通过独创的「联邦AI」的技术路线，联合多个大模型，在特定任务上超越GPT-4，体现出了多个大模型互帮互助的强大能力，而且成本也能控制在GPT-4一半的水品。

来自主题: AI技术研报

7830 点击 2024-04-02 16:05

英伟达开卷价格！最新Blackwell GPU架构/成本揭秘，彰显老黄的「仁慈」

【新智元导读】老黄新GPU深夜炸场，超高规格的背后也付出了不小的代价，小编带大家深入了解一下新架构的硬件细节和成本，新显卡的售价究竟高不高？英伟达也不得不开始卷了

来自主题: AI技术研报

7266 点击 2024-04-02 15:54

阿里7B多模态文档理解大模型拿下新SOTA｜开源

多模态文档理解能力新SOTA！阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5，针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战，提出了一系列解决方案。

来自主题: AI技术研报

7904 点击 2024-04-02 11:40

ChatGPT也在评审你的顶会投稿，斯坦福新研究捅了马蜂窝，“这下闭环了”

尴了个大尬！人们还在嘲讽有人用ChatGPT写论文忘了删掉“狐狸尾巴”，另一边审稿人也被曝出用ChatGPT写同行评论了。而且，还是来自ICLR、NeurIPS等顶会的那种。

来自主题: AI技术研报

6915 点击 2024-04-02 11:39

“大海捞针”out！“数星星”成测长文本能力更精准方法，来自鹅厂

大模型长文本能力测试，又有新方法了！

来自主题: AI技术研报

8921 点击 2024-04-02 11:36

字节的扣子炸裂更新，模型支持月之暗面，插件 IDE 已经上线。

扣子是字节跳动出品的 Agent 创作平台，不了解 Coze /扣子的朋友，可以先看看我们往期的文章

来自主题: AI技术研报

8547 点击 2024-04-02 10:13

a16z 对话 Poe 创始人：大模型幻觉是创业公司的机会；AI 的未来是多模型、多模态

作为 Meta 的前 CTO，Quora CEO Adam D'Angelo 目前还是 OpenAI 的董事会成员，在 Quora 之外推出的 Poe，成为当下接入大模型最多的 Chatbot 平台：GPT-4、Claude3、Mistral 等模型都有，用户也可以在上面搭建自己的 Chatbot 机器人，如果有别的用户使用，还可以产生收益。

来自主题: AI技术研报

9555 点击 2024-04-02 10:05

今天起，ChatGPT无需注册就能用了

OpenAI狠狠地open了一把就在刚刚，OpenAI狠狠地open了一把：从今天起，ChatGPT打开即用，无需再注册帐号和登录了！

来自主题: AI技术研报

7679 点击 2024-04-02 09:53

ICLR 2024 | 鸡生蛋蛋生鸡？再论生成数据能否帮助模型训练

随着生成模型（如 ChatGPT、扩散模型）飞速发展，一方面，生成数据质量越来越高，到了以假乱真的程度；另一方面，随着模型越来越大，也使得人类世界的真实数据即将枯竭。

来自主题: AI技术研报

11152 点击 2024-04-01 15:53

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA

2022 年底，随着 ChatGPT 的爆火，人类正式进入了大模型时代。然而，训练大模型需要的时空消耗依然居高不下，给大模型的普及和发展带来了巨大困难。面对这一挑战，原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2]，带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩，将微调技术带进千家万户。

来自主题: AI技术研报

8942 点击 2024-04-01 15:45

可编辑的DALL·E 3要来了？一句话就能PS图片

OpenAI 从未放慢前进的脚步，DALL・E 3 将支持对生成后的图片进行再次编辑。

来自主题: AI技术研报

8100 点击 2024-04-01 15:29

AI行业买英伟达GPU，花的钱比赚的多17倍

搞 AI 大模型，实在太烧钱了。我们知道，如今的生成式 AI 有很大一部分是资本游戏，科技巨头利用自身强大的算力和数据占据领先位置，并正在使用先进 GPU 的并行算力将其推广落地。这么做的代价是什么？最近《华尔街日报》一篇有关明星创业公司的报道里给出了答案：投入是产出的 17 倍。

来自主题: AI技术研报

10138 点击 2024-04-01 15:22

上海交大新框架解锁CLIP长文本能力，多模态生成细节拿捏，图像检索能力显著提升

CLIP长文本能力被解锁，图像检索任务表现显著提升！一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。

来自主题: AI技术研报

8984 点击 2024-04-01 11:26

恐怖谷！哥大华人开发「人脸机器人」，照镜子自主模仿人类表情超逼真

【新智元导读】OpenAI机器人理解力虽强，却无法进行非语言交流。最近，哥伦比亚大学华人团队打造了全新的机器人Emo，不仅可以提前预测和模拟人类表情，还可以进行眼神交流。

来自主题: AI技术研报

8952 点击 2024-04-01 11:05

芯片战争早已打响！谷歌15个月打造首个TPU，欲和老黄平起平坐

【新智元导读】在英伟达统治AI时代硬件的当下，谷歌的TPU却开辟了另一条道路。今天，小编带你了解第一块TPU的前世今生，同时揭开TPU架构的神秘面纱。

来自主题: AI技术研报

8672 点击 2024-04-01 10:10

CVPR 2024 | 让视频姿态Transformer变得飞速，北大提出高效三维人体姿态估计框架HoT

目前，Video Pose Transformer（VPT）在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来，这些 VPT 的计算量变得越来越大，这些巨大的计算量同时也限制了这个领域的进一步发展，对那些计算资源不足的研究者十分不友好。例如，训练一个 243 帧的 VPT 模型通常需要花费好几天的时间，严重拖慢了研究的进度，并成为了该领域亟待解决的一大痛点。

来自主题: AI技术研报

7713 点击 2024-03-31 14:44

GPT-4单项仅得7.1分，揭露大模型代码能力三大短板，最新基准测试来了

首个AI软件工程师Devin正式亮相，立即引爆了整个技术界。

来自主题: AI技术研报

8190 点击 2024-03-31 14:25

OpenAI藏了1年多的技术正式公开！15秒素材克隆声音，HeyGen也在用

OpenAI雪藏的新产品——语音合成引擎Voice Engine，终于被正式揭幕。有了它，只需15秒的语音样本，就能克隆出一个人的声音，而且还能跨越语言！ APP版ChatGPT中的语音对话功能，也正是由这项技术所驱动。

来自主题: AI技术研报

8025 点击 2024-03-31 14:12

非侵入设备贴在脖子上，就能代替人类发声，研究登《自然通讯》

研究人员开发了一种由 AI 驱动的发声贴片，可以非侵入性地粘附在喉部帮助发声。

来自主题: AI技术研报

8691 点击 2024-03-31 14:00

吴恩达：别光盯着GPT-5，用GPT-4做个智能体可能提前达到GPT-5的效果

AI 智能体是去年很火的一个话题，但是 AI 智能体到底有多大的潜力，很多人可能没有概念。最近，斯坦福大学教授吴恩达在演讲中提到，他们发现，基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然，基于 GPT-4 构建的智能体工作流效果更好。由此看来，AI 智能体工作流将在今年推动人工智能取得巨大进步，甚至可能超过下一代基础模型。这是一个值得所有人关注的趋势。

来自主题: AI技术研报

7908 点击 2024-03-31 13:54