AI资讯新闻榜单内容搜索-开源模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 开源模型

奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

在柏林工业大学的一场圆桌对话当中，奥特曼再一次谈到了DeepSeek，并大赞开源模型对世界的贡献。对话中，奥特曼还发表了对AGI的最新看法，透露了十足的信心，他认为，虽然会遇到阻碍和挑战，但他相信人类终将实现AGI。

来自主题: AI资讯

8820 点击 2025-02-09 09:16

Deepseek的隐喻：GPU失其鹿，ASIC、SOC们共逐之

Deepseek的隐喻：GPU失其鹿，ASIC、SOC们共逐之

Deepseek的隐喻：GPU失其鹿，ASIC、SOC们共逐之

诚如我们在《Deepseek的意义、价值与影响》中所阐述的那样，开源模型Deepseek的率先冲线，标志着 “机器智能寒武纪时刻”的启动，产业即将因此进入应用创新大爆发周期。

来自主题: AI资讯

6770 点击 2025-02-06 12:08

超越DeepSeek V3！Ai2再祭开源杀器Tülu 3，强化学习打破性能瓶颈

超越DeepSeek V3！Ai2再祭开源杀器Tülu 3，强化学习打破性能瓶颈

超越DeepSeek V3！Ai2再祭开源杀器Tülu 3，强化学习打破性能瓶颈

2024年11月，艾伦人工智能研究所（Ai2）推出了Tülu 3 8B和70B，在性能上超越了同等参数的Llama 3.1 Instruct版本，并在长达82页的论文中公布其训练细节，训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报

6085 点击 2025-02-05 16:54

Lex Fridman 五小时播客实录：中美 AI 竞争与国运

Lex Fridman 五小时播客实录：中美 AI 竞争与国运

Lex Fridman 五小时播客实录：中美 AI 竞争与国运

在这个对谈中，Lex Fridman 与半导体分析专家 Dylan Patel（SemiAnalysis 创始人）和人工智能研究科学家 Nathan Lambert（艾伦人工智能研究所）展开对话，深入探讨 DeepSeek AI 及其开源模型 V3 和 R1，以及由此引发的 AI 发展地缘政治竞争，特别是中美在 AI 芯片和技术出口管制领域的博弈。　　

来自主题: AI资讯

7077 点击 2025-02-04 18:53

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

谈到大模型的“国货之光”，除了DeepSeek之外，阿里云Qwen这边也有新动作——首次将开源Qwen模型的上下文扩展到1M长度。

来自主题: AI资讯

7517 点击 2025-01-27 14:18

DeepSeek开源o1击毙OpenAI，强化学习惊现「啊哈」时刻！网友：AGI来了

DeepSeek开源o1击毙OpenAI，强化学习惊现「啊哈」时刻！网友：AGI来了

DeepSeek开源o1击毙OpenAI，强化学习惊现「啊哈」时刻！网友：AGI来了

中国版o1刷屏全网。DeepSeek R1成为世界首个能与o1比肩的开源模型，成功秘诀竟是强化学习，不用监督微调。AI大佬们一致认为，这就是AlphaGo时刻。

来自主题: AI资讯

8090 点击 2025-01-21 12:59

微软最新复杂推理：基于过程奖励的LE-MCTS集成新方法

微软最新复杂推理：基于过程奖励的LE-MCTS集成新方法

微软最新复杂推理：基于过程奖励的LE-MCTS集成新方法

在人工智能快速发展的今天，大型语言模型（LLM）在各类任务中展现出惊人的能力。然而，当面对需要复杂推理的任务时，即使是最先进的开源模型也往往难以保持稳定的表现。现有的模型集成方法，无论是在词元层面还是输出层面的集成，都未能有效解决这一挑战。

来自主题: AI技术研报

5135 点击 2025-01-17 10:36

MiniMax开源4M超长上下文新模型！性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型！性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型！性能比肩DeepSeek-v3、GPT-4o

开源模型上下文窗口卷到超长，达400万token！刚刚，“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列，包含两个模型：基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报

7075 点击 2025-01-15 15:10

MiniMax震撼开源，突破传统Transformer架构，4560亿参数，支持400万长上下文

MiniMax震撼开源，突破传统Transformer架构，4560亿参数，支持400万长上下文

MiniMax震撼开源，突破传统Transformer架构，4560亿参数，支持400万长上下文

「2025 年，我们可能会看到第一批 AI Agent 加入劳动力大军，并对公司的生产力产生实质性的影响。」——OpenAI CEO Sam Altman

来自主题: AI技术研报

7448 点击 2025-01-15 14:06

让模型部署像调用API一样简单！1小时轻松完成超100个微调模型部署的神器来了，按量计费每月立省10万

让模型部署像调用API一样简单！1小时轻松完成超100个微调模型部署的神器来了，按量计费每月立省10万

让模型部署像调用API一样简单！1小时轻松完成超100个微调模型部署的神器来了，按量计费每月立省10万

大家可能看到过很多类似的结论：针对特定任务，对开源模型进行 LoRA 微调可以干翻 GPT-4 这类闭源模型。

来自主题: AI资讯

7070 点击 2025-01-09 09:37

上一页当前第7页,共20页下一页