AI资讯新闻榜单内容搜索-token

百万tokens低至1元！大模型越来越卷了

在刚刚举行的 ICLR 2024 大会上，智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势，同时预告了GLM的后续升级版本。

来自主题: AI资讯

5344 点击 2024-05-12 11:19

传统上，大型语言模型（LLMs）被认为是顺序解码器，逐个解码每个token。

来自主题: AI技术研报

4109 点击 2024-05-10 23:29

开源大模型领域，又迎来一位强有力的竞争者。

来自主题: AI技术研报

10316 点击 2024-05-07 18:24

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键，但现状是，开源的大模型有一堆，可开源的大规模数据却没多少，而收集、清洗数据又是一项极其费时费力的工作，也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报

5066 点击 2024-05-05 19:51

AI做数学题，真正的思考居然是暗中“心算”的？

来自主题: AI技术研报

5924 点击 2024-05-05 19:25

“预测下一个token”被认为是大模型的基本范式，一次预测多个tokens又会怎样？

来自主题: AI技术研报

5217 点击 2024-05-03 22:03

2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。

来自主题: AI技术研报

4868 点击 2024-05-02 18:03

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

7647 点击 2024-04-29 20:31

大模型力大砖飞，让LLaMA3演绎出了新高度：超15T Token数据上的超大规模预训练，既实现了令人印象深刻的性能提升，也因远超Chinchilla推荐量再次引爆开源社区讨论。

来自主题: AI技术研报

6749 点击 2024-04-28 15:03

Llama 3诞生之后便艳压群雄，开源界已无「模」能敌。

来自主题: AI资讯

2188 点击 2024-04-21 23:29