AI资讯新闻榜单内容搜索-scaling

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: scaling
再谈复现 Sora:被仰望与被遗忘的

再谈复现 Sora:被仰望与被遗忘的

再谈复现 Sora:被仰望与被遗忘的

2月16日,OpenAI 发布了视频生成领域的重磅模型 —— Sora。Sora 对 Scaling Law 的信仰及其突破性的技术创新,使它持续保持领先地位。同时,也再次证明了“大力出奇迹”依然适用于文生视频领域。

来自主题: AI资讯
9915 点击    2024-03-27 11:09
如何从零开始训练大模型(minicpm分享&讨论)

如何从零开始训练大模型(minicpm分享&讨论)

如何从零开始训练大模型(minicpm分享&讨论)

根据scaling law,模型越大,高质量数据越多,效果越好。 但还有一个很直观的情况,随着预训练样本的质量不断提升,训练手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。

来自主题: AI技术研报
2447 点击    2024-03-19 15:55
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。

来自主题: AI技术研报
4147 点击    2024-03-07 14:01
朱啸虎讲了一个中国现实主义AIGC故事

朱啸虎讲了一个中国现实主义AIGC故事

朱啸虎讲了一个中国现实主义AIGC故事

中国科技界针对大模型的态度已分裂成两股阵营。一股是技术信仰派,他们大多技术出身,认为应该像OpenAI一样信仰AGI、信仰scaling law(规模定律),

来自主题: AI资讯
4090 点击    2024-03-06 15:06
AI规模法则:大力何以出奇迹?

AI规模法则:大力何以出奇迹?

AI规模法则:大力何以出奇迹?

AI 研究走过的最大弯路,就是过于重视人类既有经验和知识。

来自主题: AI资讯
4007 点击    2024-03-06 10:56
几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

本文提出了扩散模型中UNet的long skip connection的scaling操作可以有助于模型稳定训练的分析,目前已被NeurIPS 2023录用。同时,该分析还可以解释扩散模型中常用但未知原理的1/√2 scaling操作能加速训练的现象。

来自主题: AI技术研报
7053 点击    2024-02-29 13:52
大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

大模型的成功很大程度上要归因于 Scaling Law 的存在,这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系,为模型开发、资源分配和选择合适的训练数据提供了宝贵的指导。

来自主题: AI技术研报
2678 点击    2024-02-27 14:00
Scaling 能通往 AGI 吗?万字科普 Scaling Law 的业内争议与讨论

Scaling 能通往 AGI 吗?万字科普 Scaling Law 的业内争议与讨论

Scaling 能通往 AGI 吗?万字科普 Scaling Law 的业内争议与讨论

Dwarkesh 预计,有 70% 左右的概率人们能够通过 scaling 在 2024 年之前实现更强的 AI,这种 AI 能够实现大量认知劳动的自动化,进而促进 AI 的进一步发展。但如果 scaling law 失效,那么实现 AGI 的过程会非常漫长和艰难。

来自主题: AI资讯
4261 点击    2024-02-25 11:47
Sora带来的四点启发

Sora带来的四点启发

Sora带来的四点启发

本文总结了关于Sora的四点启发,包括视觉数据训练出更强的泛化能力、OpenAI的Scaling Law路线、与AGI的第一次亲密接触以及OpenAI的宣传策略。

来自主题: AI资讯
3936 点击    2024-02-19 10:22
解析大模型中的Scaling Law

解析大模型中的Scaling Law

解析大模型中的Scaling Law

计划训练一个10B的模型,想知道至少需要多大的数据?收集到了1T的数据,想知道能训练一个多大的模型?老板准备1个月后开发布会,给的资源是100张A100,那应该用多少数据训一个多大模型最终效果最好?

来自主题: AI技术研报
10989 点击    2023-11-20 10:09