AI资讯新闻榜单内容搜索-7B模型

50s完成7B模型量化，4bit达到新SOTA，大模型低比特量化有新招了 | NeurIPS 2024 Oral

消除激活值(outliers)，大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 2024（Oral Presentation），他们针对LLM权重激活量化提出了两种正交变换，有效降低了outliers现象，达到了4-bit的新SOTA。

来自主题: AI技术研报

4784 点击 2024-11-07 20:51

哪个模型擅长调用工具？这个7B模型跻身工具调用综合榜单第一

工具调用是 AI 智能体的关键功能之一，AI 智能体根据场景变化动态地选择和调用合适的工具，从而实现对复杂任务的自动化处理。例如，在智能办公场景中，模型可同时调用文档编辑工具、数据处理工具和通信工具，完成文档撰写、数据统计和信息沟通等多项任务。

来自主题: AI技术研报

3264 点击 2024-10-24 15:40

苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。大模型，AI，苹果AI，苹果开源模型

来自主题: AI资讯

8358 点击 2024-07-23 00:14

明星AI独角兽Mistral AI亮出大模型新王炸，代码和数学能力超群

Mistral AI两款全新7B模型宣战OpenAI，对标更长的代码分析和更高效的数学推理。

来自主题: AI资讯

5823 点击 2024-07-19 10:37

只激活3.8B参数，性能比肩同款7B模型！训练微调都能用，来自微软

只需激活60%的参数，就能实现与全激活稠密模型相当的性能。

来自主题: AI技术研报

10173 点击 2024-07-18 16:44

原作亲自下场！Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

最近，7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后，Mistral今天又发布了两个7B模型，分别是针对STEM学科的Mathstral，以及使用Mamaba架构的代码模型Codestral Mamba。

来自主题: AI技术研报

10105 点击 2024-07-17 19:53

清华北航博士生「强迫」Gemma-2说中文！弱智吧、角色扮演、数学问题表现惊喜

谷歌的Gemma 2刚刚发布，清华和北航的两名博士生就已经成功推出了指令微调版本，显著增强了Gemma 2 9B/27B模型的中文通用对话、角色扮演、数学、工具使用等能力。

来自主题: AI资讯

10232 点击 2024-07-06 18:50

鹅厂造10亿虚拟人格专搞数据合成：让7B模型数学成绩打平GPT4，还能给弱智吧出题

10亿名“员工”生产数据合成，数量占到了世界人口的13%。

来自主题: AI资讯

4492 点击 2024-07-02 18:09

谷歌开源系模型第二代免费开放！27B媲美LLaMA3 70B，单H100或TPU主机可跑

谷歌开源模型Gemma 2开放了！虽然前段时间Google I/O大会上，Gemma 2开源的消息就已经被放出，但谷歌还留了个小惊喜—— 除27B模型外，还有一个更轻的9B版本。 DeepMind创始人哈萨比斯表示，27B参数规模下，Gemma 2提供了同类模型最强性能，甚至还能与其两倍大的模型竞争。

来自主题: AI技术研报

8851 点击 2024-06-29 00:02

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发布Q*算法

近日，一篇出自中国团队之手的AI论文在外网引发热议。论文中，研究团队提出了Q*模型算法，帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。

来自主题: AI资讯

11300 点击 2024-06-26 10:57