AI资讯新闻榜单内容搜索-7B模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 7B模型

昆仑万维携手南洋理工大学抢发Q*算法：百倍提升7B模型推理能力

昆仑万维携手南洋理工大学抢发Q*算法：百倍提升7B模型推理能力

昆仑万维携手南洋理工大学抢发Q*算法：百倍提升7B模型推理能力

自 OpenAI 的 Q* 项目曝光后，引发业内众多讨论。据现有信息汇总，Q* 项目被视作 OpenAI 在探索人工通用智能（Artificial General Intelligence, AGI）道路上的一次重大尝试，有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。

来自主题: AI技术研报

10860 点击 2024-06-25 18:20

GPT-4搞不定的图推理，港科大7B模型搞定｜KDD2024

GPT-4搞不定的图推理，港科大7B模型搞定｜KDD2024

GPT-4搞不定的图推理，港科大7B模型搞定｜KDD2024

大模型执行图推理任务，我们是希望大模型仅仅给出结果，还是在给出准确答案的同时，输出详细的推理过程？

来自主题: AI技术研报

9416 点击 2024-06-11 16:09

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

把AlphaGo的核心算法用在大模型上，“高考”成绩直接提升了20多分。

来自主题: AI技术研报

9225 点击 2024-05-09 15:48

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果，然而，Transformer 中自注意力带来的二次复杂度使得大模型的推理成本和内存占用十分巨大，特别是在长序列的场景中。

来自主题: AI技术研报

5869 点击 2024-04-03 17:29

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

大模型内卷时代，也不断有人跳出来挑战Transformer的统治地位，RWKV最新发布的Eagle 7B模型登顶了多语言基准测试，同时成本降低了数十倍

来自主题: AI技术研报

6226 点击 2024-02-20 11:12

最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

Mixtral 8x7B模型开源后，AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B，在主流基准测试中击败了Mixtral Instruct。

来自主题: AI技术研报

8270 点击 2024-01-19 14:25

一条磁力链爆全网，Mixtral 8x7B论文来了！碾压Llama 2 70B，每token仅需激活13B参数

一条磁力链爆全网，Mixtral 8x7B论文来了！碾压Llama 2 70B，每token仅需激活13B参数

一条磁力链爆全网，Mixtral 8x7B论文来了！碾压Llama 2 70B，每token仅需激活13B参数

爆火社区的Mixtral 8x7B模型，今天终于放出了arXiv论文！所有模型细节全部公开了。

来自主题: AI资讯

7169 点击 2024-01-10 17:01

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

近日，来自华为诺亚方舟实验室、北京大学等机构的研究者提出了盘古 π 的网络架构，尝试来构建更高效的大模型架构。

来自主题: AI资讯

9783 点击 2023-12-30 15:20

超越同级7B模型！中国团队开源大规模高质量图文数据集ShareGPT4V，大幅提升多模态性能

超越同级7B模型！中国团队开源大规模高质量图文数据集ShareGPT4V，大幅提升多模态性能

超越同级7B模型！中国团队开源大规模高质量图文数据集ShareGPT4V，大幅提升多模态性能

研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V，并在此基础上训练了一个7B模型，在多项多模态榜单上超越了其他同级模型。

来自主题: AI技术研报

10467 点击 2023-11-29 15:05

上一页当前第4页,共4页下一页