AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

烧钱、耗费资源、难以盈利，被持续唱衰的大语言模型在艰难中倔强前行

烧钱、耗费资源、难以盈利，被持续唱衰的大语言模型在艰难中倔强前行

烧钱、耗费资源、难以盈利，被持续唱衰的大语言模型在艰难中倔强前行

国庆节过后，人工智能领域似乎多了几分冷色调。不知道是因为大语言模型（Large Language Model，LLM）的幻觉，还是因为寒露时节的到来。

来自主题: AI资讯

6350 点击 2024-10-15 14:59

Benchmark合伙人：训练大模型目前成本远大于收入；但理论上成功回报极大，所以你仍需不断加注

Benchmark合伙人：训练大模型目前成本远大于收入；但理论上成功回报极大，所以你仍需不断加注

Benchmark合伙人：训练大模型目前成本远大于收入；但理论上成功回报极大，所以你仍需不断加注

随着LLM的进步，它将超越代码补全（“Copilot”）的功能，进入代码创作（“Autopilot”）的领域。随着LLM变得越来越复杂，它们能够释放的经济价值也会越来越大。AGI的经济价值仅受我们的想象力限制。

来自主题: AI资讯

4762 点击 2024-10-15 14:01

苹果研究员质疑大模型，我们测试了6款，发现了4大真相

苹果研究员质疑大模型，我们测试了6款，发现了4大真相

苹果研究员质疑大模型，我们测试了6款，发现了4大真相

别信忽悠，信实测。

来自主题: AI资讯

4352 点击 2024-10-15 10:32

【人工智能】多模态AI——融合多种数据源的智能系统

【人工智能】多模态AI——融合多种数据源的智能系统

【人工智能】多模态AI——融合多种数据源的智能系统

多模态AI是一种将不同形式的数据(如文本、图像、音频等)融合在一起的技术，旨在让模型从多个维度感知和理解信息。这种融合使得AI系统能够从每种模态中获取独特的但互补的信息，从而构建出更全面的世界观。例如，在一个自动驾驶场景中，图像数据可以帮助系统识别道路上的行人，而雷达数据则能够感知车距，两者结合能够显著提升决策准确性。

来自主题: AI资讯

8250 点击 2024-10-15 09:56

图灵奖得主Yoshua Bengio新作：Were RNNs All We Needed?

图灵奖得主Yoshua Bengio新作：Were RNNs All We Needed?

图灵奖得主Yoshua Bengio新作：Were RNNs All We Needed?

自从 Transformer 模型问世以来，试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手，不仅要挑战 Transformer 的地位，还致敬了经典论文的名字。再看这篇论文的作者列表，图灵奖得主、深度学习三巨头之一的 Yoshua Bengio 赫然在列。

来自主题: AI技术研报

5814 点击 2024-10-14 15:42

扩散模型训练方法一直错了！谢赛宁：Representation matters

扩散模型训练方法一直错了！谢赛宁：Representation matters

扩散模型训练方法一直错了！谢赛宁：Representation matters

是什么让纽约大学著名研究者谢赛宁三连呼喊「Representation matters」？他表示：「我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言，表征也依然有用。基于此，他们提出了 REPA，即表征对齐技术，其能让「训练扩散 Transformer 变得比你想象的更简单。」

来自主题: AI技术研报

5237 点击 2024-10-14 15:22

AI作曲缺数据，浙大GTSinger数据集上线：适配所有歌声任务、带有真实乐谱

AI作曲缺数据，浙大GTSinger数据集上线：适配所有歌声任务、带有真实乐谱

AI作曲缺数据，浙大GTSinger数据集上线：适配所有歌声任务、带有真实乐谱

传统的歌声任务，如歌声合成，大多是在利用输入的歌词和乐谱生成高质量的歌声。随着深度学习的发展，人们希望实现可控和能个性化定制的歌声生成。

来自主题: AI技术研报

7863 点击 2024-10-14 10:38

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

1%的合成数据，就让LLM完全崩溃了？ 7月，登上Nature封面一篇论文证实，用合成数据训练模型就相当于「近亲繁殖」，9次迭代后就会让模型原地崩溃。

来自主题: AI技术研报

6063 点击 2024-10-14 10:12

深度｜普林斯顿教授Arvind：构建大参数模型不再有效，数据正成为瓶颈；社会对AI过度恐惧

深度｜普林斯顿教授Arvind：构建大参数模型不再有效，数据正成为瓶颈；社会对AI过度恐惧

深度｜普林斯顿教授Arvind：构建大参数模型不再有效，数据正成为瓶颈；社会对AI过度恐惧

计算资源并非性能提升的唯一途径：Arvind Narayanan 认为，仅仅增加计算资源并不总是能带来模型性能的等比提升。目前，数据量正逐渐成为限制AI发展的主要瓶颈。

来自主题: AI资讯

5859 点击 2024-10-14 09:17

苹果发文质疑：大语言模型根本无法进行逻辑推理

苹果发文质疑：大语言模型根本无法进行逻辑推理

苹果发文质疑：大语言模型根本无法进行逻辑推理

5 大证据显示，LLM 在推理复杂问题时非常脆弱。

来自主题: AI资讯

4441 点击 2024-10-14 09:16

上一页当前第313页,共386页下一页