AI资讯新闻榜单内容搜索-大模型

350亿参数、开放权重，Transformer作者创业后推出新大模型

开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的 Cohere 公司推出的大模型 Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。

来自主题: AI技术研报

7501 点击 2024-03-12 18:54

马斯克官宣：本周将开源自家大模型Grok！在跟OpenAI打官司的关键时刻来这么一手，可以说是成功占领开源的道德高地，方向明确，效果显著。

来自主题: AI资讯

5662 点击 2024-03-12 18:41

清华系多模态大模型公司，又拿钱了！

来自主题: AI资讯

8042 点击 2024-03-12 18:17

基于大模型的Agent，已经成为了大型的博弈游戏的高级玩家，而且玩的还是德州扑克、21点这种非完美信息博弈。

来自主题: AI技术研报

4324 点击 2024-03-12 18:13

中美六大云巨头，偏爱14家大模型创企。

来自主题: AI资讯

7495 点击 2024-03-12 10:56

资本永远在追逐风口，从二次元、元宇宙、AI到短剧……每一次技术革新与新赛道的崛起将掀起投资狂潮。而自2022年底就异常火爆的AI大模型及应用，随着新技术的不断推出（如Sora的问世），至今依然备受瞩目。

来自主题: AI资讯

10072 点击 2024-03-12 10:46

来自零一万物最新研发的高性能向量数据库笛卡尔（Descartes），登顶权威测评榜单。

来自主题: AI技术研报

11714 点击 2024-03-11 18:09

挖掘大模型固有的长文本理解能力，InfLLM在没有引入额外训练的情况下，利用一个外部记忆模块存储超长上下文信息，实现了上下文长度的扩展。

来自主题: AI技术研报

6346 点击 2024-03-11 17:31

近年来，大语言模型（LLMs）由于其通用的问题处理能力而引起了大量的关注。现有研究表明，适当的提示设计（prompt enginerring），例如思维链（Chain-of-Thoughts），可以解锁 LLM 在不同领域的强大能力。

来自主题: AI资讯

6801 点击 2024-03-11 17:28

近期，来自华为诺亚方舟实验室的研究者提出了 DenseSSM，用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中，DenseSSM 保留了对最终输出至关重要的精细信息。

来自主题: AI技术研报

10591 点击 2024-03-11 17:22