AI资讯新闻榜单内容搜索-GPT-2

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

自GPT-2以来，大模型的整体架构虽然未有大的变化，但从未停止演化的脚步。借OpenAI开源gpt-oss（120B/20B），Sebastian Raschka博士将我们带回硬核拆机现场，回溯了从GPT-2到gpt-oss的大模型演进之路，并将gpt-oss与Qwen3进行了详细对比。

来自主题: AI技术研报

8860 点击 2025-08-18 11:13

云计算一哥首度牵手OpenAI，大模型「选择」自由，才是终极胜利

昨天是个热闹的日子，OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型：前者是自 GPT-2 以来重新开源的两款模型 gpt-oss（120b 和 20b），后者是 Claude 系列最强的 Opus 4.1。

来自主题: AI资讯

8441 点击 2025-08-08 12:26

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报

8682 点击 2025-08-08 11:52

最强开源120b模型！OpenAI/国产终极二选一，速来看实测～

一直被称为"CloseAI"的OpenAI，终于舍得发布了他们继GPT-2之后的第一个开源模型：GPT-OSS

来自主题: AI产品测评

9026 点击 2025-08-07 17:45

万亿参数狂欢！一文刷爆2025年七大顶流大模型架构

从GPT-2到DeepSeek-V3和Kimi K2，架构看似未变，却藏着哪些微妙升级？本文深入剖析2025年顶级开源模型的创新技术，揭示滑动窗口注意力、MoE和NoPE如何重塑效率与性能。

来自主题: AI技术研报

8485 点击 2025-08-04 12:05

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

从GPT-2到Llama 4，大模型这几年到底「胖」了多少？从百亿级密集参数到稀疏MoE架构，从闭源霸权到开源反击，Meta、OpenAI、Mistral、DeepSeek……群雄割据，谁能称王？

来自主题: AI技术研报

8434 点击 2025-07-16 16:18

OpenAI要Open了！奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

OpenAI真的要开源了！奥特曼官宣，即将开源自GPT-2以来的首款推理模型，可在消费级硬件上运行。同时，OpenAI又拿到了最高400亿单轮融资，估值直冲3000亿。

来自主题: AI资讯

8859 点击 2025-04-01 10:40

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的”

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

来自主题: AI资讯

10010 点击 2025-04-01 09:15

还得是上海！百亿级大模型项目现场对接，只用3天

DeepSeek彻底引爆大模型应用落地。

来自主题: AI资讯

8683 点击 2025-02-23 18:06

从2019年到现在，是时候重新审视Tokenization了

2019 年问世的 GPT-2，其 tokenizer 使用了 BPE 算法，这种算法至今仍很常见，但这种方式是最优的吗？来自 HuggingFace 的一篇文章给出了解释。

来自主题: AI技术研报

9797 点击 2025-01-04 14:20

AI资讯新闻榜单内容搜索-GPT-2

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

云计算一哥首度牵手OpenAI，大模型「选择」自由，才是终极胜利

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

最强开源120b模型！OpenAI/国产 终极二选一，速来看实测～

万亿参数狂欢！一文刷爆2025年七大顶流大模型架构

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

OpenAI要Open了！奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的”

还得是上海！百亿级大模型项目现场对接，只用3天

从2019年到现在，是时候重新审视Tokenization了

最强开源120b模型！OpenAI/国产终极二选一，速来看实测～