AI资讯新闻榜单内容搜索-AL

魅族做「AI时代树莓派」：100万元奖金，开发大模型应用可拿

All in AI的魅族，马上就带来具体新动作了。

来自主题: AI资讯

7280 点击 2024-03-01 13:17

本文提出了扩散模型中UNet的long skip connection的scaling操作可以有助于模型稳定训练的分析，目前已被NeurIPS 2023录用。同时，该分析还可以解释扩散模型中常用但未知原理的1/√2 scaling操作能加速训练的现象。

来自主题: AI技术研报

8510 点击 2024-02-29 13:52

根据 OpenAI 披露的技术报告，Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式，并通过 Transformer 和扩散模型结合，展现了卓越的扩展（scale）特性。

来自主题: AI技术研报

8304 点击 2024-02-29 13:35

成立仅9个月，法国Mistral AI拿出仅次于GPT-4的大模型。

来自主题: AI技术研报

5773 点击 2024-02-28 16:37

2月26日，总部位于巴黎的人工智能公司Mistral AI发布尖端文本生成模型Mistral Large。该模型达到了顶级的推理能力，可用于复杂的多语言推理任务，包括文本理解、转换和代码生成。

来自主题: AI资讯

4985 点击 2024-02-28 16:22

Reddit和OpenAI及谷歌，竟有着如此错综复杂的关系？最近，Reddit和谷歌双双官宣了一项6000万美元的合作协议，Reddit的数据将帮助谷歌训练AI模型。巧的是，Altman正是Reddit股东之一。

来自主题: AI资讯

9679 点击 2024-02-28 16:08

随着大语言模型（LLMs）在近年来取得显著进展，它们的能力日益增强，进而引发了一个关键的问题：如何确保他们与人类价值观对齐，从而避免潜在的社会负面影响？

来自主题: AI技术研报

10679 点击 2024-02-27 14:03

大模型的成功很大程度上要归因于 Scaling Law 的存在，这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系，为模型开发、资源分配和选择合适的训练数据提供了宝贵的指导。

来自主题: AI技术研报

3417 点击 2024-02-27 14:00

SemiAnalysis的行业专家对最近爆火的Groq推理系统进行了像素级的拆解，测算出其持有成本依然高达现有H100的10倍，看来要赶上老黄的步伐，初创公司还有很多要做。

来自主题: AI技术研报

5975 点击 2024-02-26 18:03

Dwarkesh 预计，有 70% 左右的概率人们能够通过 scaling 在 2024 年之前实现更强的 AI，这种 AI 能够实现大量认知劳动的自动化，进而促进 AI 的进一步发展。但如果 scaling law 失效，那么实现 AGI 的过程会非常漫长和艰难。

来自主题: AI资讯

5372 点击 2024-02-25 11:47