AI资讯新闻榜单内容搜索-LAM

Llama 3 发布！目前最强开源大模型，全面登陆 Meta 系产品，即将推出 4000 亿模型

Meta 于本周四正式发布 Llama 3，官方号称「有史以来最强大的开源大模型」。

来自主题: AI技术研报

7985 点击 2024-04-19 10:50

革命新架构掀翻Transformer！无限上下文处理，2万亿token碾压Llama 2

继Mamba之后，又一敢于挑战Transformer的架构诞生了！

来自主题: AI技术研报

6278 点击 2024-04-17 19:23

闭源才能赚钱，百度给闭源大模型投了一票

早前Meta的LLaMA大模型“意外”泄露后，大模型的开源与闭源之争就此提上了日程。大模型到底是开源好、还是闭源好？过去一年整个AI业界可谓是争吵不休。如今，又有一位重量级人士站出来表态了。

来自主题: AI资讯

11829 点击 2024-04-17 17:22

刚刚，Mistral AI最新磁力链放出！8x22B MoE模型，281GB解禁

一条磁力链，Mistral AI又来闷声不响搞事情。

来自主题: AI资讯

7526 点击 2024-04-11 16:39

北大开源最强aiXcoder-7B代码大模型！聚焦真实开发场景，专为企业私有部署设计

来自Meta、基于Llama2，可是开源界最先进的AI编程大模型之作

来自主题: AI资讯

6400 点击 2024-04-11 10:02

Llama架构比不上GPT2？神奇token提升10倍记忆？

近日，朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3：知识的 Scaling Laws》用海量实验（50,000 条任务，总计 4,200,000 GPU 小时）总结了 12 条定律，为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯

6769 点击 2024-04-10 19:11

120亿Stable LM 2上线即开源！2万亿token训练，碾压Llama 2 70B

Stability AI推出Stable LM 2 12B模型，作为其新模型系列的进一步升级，该模型基于七种语言的2万亿Token进行训练，拥有更多参数和更强性能，据称在某些基准下能超越Llama 2 70B。

来自主题: AI技术研报

9104 点击 2024-04-09 15:44

Llama提速500%！谷歌美女程序员手搓矩阵乘法内核

近日，天才程序员Justine Tunney发推表示自己更新了Llamafile的代码，通过手搓84个新的矩阵乘法内核，将Llama的推理速度提高了500%！

来自主题: AI技术研报

6646 点击 2024-04-07 17:49

超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k

在大模型落地应用的过程中，端侧 AI 是非常重要的一个方向。近日，斯坦福大学研究人员推出的 Octopus v2 火了，受到了开发者社区的极大关注，模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行，在准确性和延迟方面超越了 GPT-4，并将上下文长度减少了 95%。此外，Octopus v2 比 Llama7B + RAG 方案快 36 倍。

来自主题: AI技术研报

9089 点击 2024-04-07 17:44

OpenAI 核心创始成员Andrej：让大模型像人脑一样低功耗运行

关注 OpenAI核心创始成员Andrej Karpathy 深度分享AI大模型发展及Elon管理法则。近日，OpenAI核心创始成员Andrej Karpathy（已于24年2月离职）在红杉资本进行了一场精彩的分享。

来自主题: AI资讯

8550 点击 2024-04-07 13:09