AI资讯新闻榜单内容搜索-token

时隔一年Falcon回归！110亿参数5.5万亿token，性能超越Llama 3

5月14日，开源的大语言模型Falcon 2发布，性能超越Llama 3，消息登上了Hacker News热榜第一。「猎鹰」归来，开源宇宙将会迎来新的霸主吗？

来自主题: AI技术研报

9500 点击 2024-05-20 16:14

前几天，普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型，论文提出构建完全可微的MoE模型，是一种预训练自回归语言模型的新方法。

来自主题: AI技术研报

9576 点击 2024-05-20 16:10

GPT-4o发布不到一周，首个敢于挑战王者的新模型诞生！最近，Meta团队发布了「混合模态」Chameleon，可以在单一神经网络无缝处理文本和图像。10万亿token训练的34B参数模型性能接近GPT-4V，刷新SOTA。

来自主题: AI技术研报

8542 点击 2024-05-19 15:48

70B模型，秒出1000token，换算成字符接近4000！

来自主题: AI技术研报

8173 点击 2024-05-17 17:45

大模型正以前所未有的速度重塑我们的工作和生活方式，人们期待大模型走向千行百业，为实际业务带来真正的价值提升。

来自主题: AI技术研报

4439 点击 2024-05-16 16:53

大模型的性价比之战已经来到了新的阶段。

来自主题: AI资讯

9065 点击 2024-05-15 23:30

秀杀手级AI玩法、Gemini安卓合体截胡苹果、最强TPU，谷歌2小时提了121次AI。

来自主题: AI资讯

7130 点击 2024-05-15 17:16

红极一时的思维链技术，可能要被推翻了！

来自主题: AI技术研报

4585 点击 2024-05-14 10:49

关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。

来自主题: AI技术研报

10280 点击 2024-05-13 17:28

昨天刚刚在顶会ICLR作为特邀演讲（Invited Talk）中“国内唯一”的大模型玩家智谱AI，今天又放出了一个好消息

来自主题: AI技术研报

8197 点击 2024-05-12 12:35