AI资讯新闻榜单内容搜索-Scaling

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Scaling
奥特曼斯坦福演讲全场爆满!GPT-5强到发指,Scaling Law依然有效

奥特曼斯坦福演讲全场爆满!GPT-5强到发指,Scaling Law依然有效

奥特曼斯坦福演讲全场爆满!GPT-5强到发指,Scaling Law依然有效

AI届大红人Altman在母校斯坦福开讲当天,在场的学生挤爆了英伟达礼堂。 去礼堂路的上,人满为患,超1000人早早排在了门口。

来自主题: AI技术研报
3886 点击    2024-04-27 12:32
股价久违飙涨,商汤要用自己的Scaling law挑战GPT4

股价久违飙涨,商汤要用自己的Scaling law挑战GPT4

股价久违飙涨,商汤要用自己的Scaling law挑战GPT4

4月24日,商汤集团在港交所暂停交易,暂停交易前上涨31.15%。商汤集团回应,“昨日日日新大模型5.0发布会广受好评,受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告。”

来自主题: AI资讯
8661 点击    2024-04-25 16:41
一文读懂具身智能:巨头在做什么、创业公司机会在哪、数据和 Scaling Law 难题怎么解决?

一文读懂具身智能:巨头在做什么、创业公司机会在哪、数据和 Scaling Law 难题怎么解决?

一文读懂具身智能:巨头在做什么、创业公司机会在哪、数据和 Scaling Law 难题怎么解决?

Google RT-2、Figure 01 机器人、特斯拉 Optimus 等的新演示让「具身智能」这一概念成为了机器人和大模型领域的热门话题

来自主题: AI资讯
4252 点击    2024-04-22 21:02
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
4228 点击    2024-04-10 19:11
Q1 AGI 融资万字盘点:单笔最高30亿、PMF海外已跑通、资本军备竞赛已开启

Q1 AGI 融资万字盘点:单笔最高30亿、PMF海外已跑通、资本军备竞赛已开启

Q1 AGI 融资万字盘点:单笔最高30亿、PMF海外已跑通、资本军备竞赛已开启

在这个风起云涌的 AI 时代,一场前所未有的资本军备竞赛正在火热上演。算力、算法、数据,这些被视为 AI 领域的三大基石,正成为各大公司争夺的焦点。然而,在这场看似技术驱动的竞赛背后,低成本资金的获取却成为了决定胜负的隐形推手。

来自主题: AI资讯
6018 点击    2024-04-08 09:20
国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI

国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI

国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI

LLM战场的新玩家,一出手就是王炸!信仰Scaling Law的阶跃星辰,一口气带来了Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版。而阶跃星辰之旅,终点就是AGI。

来自主题: AI资讯
3793 点击    2024-04-01 18:50
比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发展带来了巨大困难。面对这一挑战,原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2],带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩,将微调技术带进千家万户。

来自主题: AI技术研报
8237 点击    2024-04-01 15:45