AI资讯新闻榜单内容搜索-LAM

GPU 维修那些事： H100 哪里容易坏？以 Llama3 训练大模型为例

根据去年2024年7月28日Meta公司在训练大模型（Llama 3）时使用“16384 个英伟达H100 GPU 集群”的经验，该显卡在高负载、大规模集群运行环境下容易出现以下故障点：

来自主题: AI技术研报

12587 点击 2025-04-07 09:17

原生多模态Llama 4终于问世，开源王座一夜易主！首批共有两款模型Scout和Maverick，前者业界首款支持1000万上下文单H100可跑，后者更是一举击败了DeepSeek V3。目前，2万亿参数巨兽还在训练中。

来自主题: AI技术研报

10456 点击 2025-04-06 18:06

AI不过周末，硅谷也是如此。大周日的，Llama家族上新，一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列，目前共有三个款：Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

来自主题: AI资讯

11265 点击 2025-04-06 12:15

刚刚，奥特曼接连抛出重磅消息：GPT-5不仅将免费开放，还将整合多项尖端技术。o3和o4-mini即将在几周内亮相，还有一个神秘的开源推理模型要来。然而，另一边Meta的Llama 4却因性能瓶颈屡次延期，AI竞赛的格局愈发扑朔迷离。

来自主题: AI资讯

10192 点击 2025-04-05 15:13

Meta AI研究副总裁Pineau亲自发帖声称将于5月30日离职，她主导了Llama开源系列及PyTorch项目。此举正逢扎克伯格重金投入AI及LlamaCon AI大会前夕，引发业内对Meta战略调整和未来新作的诸多猜测。

来自主题: AI资讯

11152 点击 2025-04-05 01:09

最近，AI 公司 Databricks 推出了一种新的调优方法 TAO，只需要输入数据，无需标注数据即可完成。更令人惊喜的是，TAO 在性能上甚至超过了基于标注数据的监督微调。

来自主题: AI技术研报

9607 点击 2025-03-30 14:33

家人们震惊了！现在 AI 成精啦，不仅能写能画，现在连唱功都是格莱美级的了！

来自主题: AI技术研报

6304 点击 2025-03-27 14:07

本文介绍了当前最受科研人员青睐的AI模型，推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonnet和开源明星Olmo 2，它们各有优劣，为科研人员提供了多样选择。

来自主题: AI资讯

11777 点击 2025-03-25 11:53

在 2024 年七月的一篇博客文章中，Meta CEO 马克·扎克伯格表示，“出售访问权限”给 Meta 公开可用的 Llama AI 模型“不是 Meta 的商业模式。”

来自主题: AI资讯

11721 点击 2025-03-24 10:52

从自动驾驶、机器人导航，到AR/VR等前沿应用，SLAM都是离不开的核心技术之一。

来自主题: AI技术研报

7701 点击 2025-03-19 14:34