AI资讯新闻榜单内容搜索-大模型训练

大模型正在从黄金时代进入白银时代

越来越多人开始关注大模型，很多做工程开发的同学问我怎么入门大模型训练推理系统软件（俗称大模型Infra）。

来自主题: AI资讯

10652 点击 2024-08-16 20:52

70倍极致压缩！大模型的检查点再多也不怕

大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」，吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大，系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里，系统会崩溃 466 次，平均 2.78 小时一次！

来自主题: AI技术研报

10110 点击 2024-08-05 14:04

存储大厂“激战”HBM

HBM因AI大模型训练需求爆增，市场火热。

来自主题: AI资讯

7177 点击 2024-07-15 13:44

H100利用率飙升至75%！英伟达亲自下场FlashAttention三代升级，比标准注意力快16倍

大模型训练推理神作，又更新了！

来自主题: AI资讯

10860 点击 2024-07-12 15:39

Anthropic CEO：大模型训练成本暴涨，2027年将达1000亿美元！

Anthropic首席执行官表示，当前AI模型训练成本是10亿美元，未来三年，这个数字可能会上升到100亿美元甚至1000亿美元。要知道，GPT-4o这个曾经最大的模型也只用了1亿美元。千亿美刀，究竟花在了哪里？

来自主题: AI资讯

10115 点击 2024-07-09 01:10

星环科技孙元浩：语料已经是大模型最大的挑战

「原来以为语料已经匮乏了，大模型训练已经没有语料了，实际上不是的，数据还远远没有跑光」。

来自主题: AI资讯

9797 点击 2024-06-16 18:09

估值飙至138亿美元！27岁华裔天才少年再获融资，数据标注会是下一个风口？

Alexandr Wang创办的Scale AI是一个为AI模型提供训练数据的数据标注平台，近期完成新一轮10亿美元融资，估值飙升至138亿美元。该公司表示将利用新资金生产丰富的前沿数据，为通向AGI铺平道路。

来自主题: AI资讯

11663 点击 2024-05-26 12:05

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显存」中，我们介绍了Unsloth，这是一个大模型训练加速和显存高效的训练框架，我们已将其整合到Firefly训练框架中，并且对Llama3-8B的训练进行了测试，Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报

5946 点击 2024-05-08 12:21

一个大模型训练成本要上亿美元，为何开发AI如此烧钱？

AI发展驱动收入增长，但成本激增需大投资。

来自主题: AI资讯

5654 点击 2024-05-07 11:19

李飞飞团队年度报告揭底大模型训练成本：Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年？除了直观的感受，你还需要一份系统的总结

来自主题: AI技术研报

6382 点击 2024-04-16 21:53