AI资讯新闻榜单内容搜索-GPT-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT-2
云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利

云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利

云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利

昨天是个热闹的日子,OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型:前者是自 GPT-2 以来重新开源的两款模型 gpt-oss(120b 和 20b),后者是 Claude 系列最强的 Opus 4.1。

来自主题: AI资讯
6219 点击    2025-08-08 12:26
硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报
6237 点击    2025-08-08 11:52
最强开源120b模型!OpenAI/国产 终极二选一,速来看实测~

最强开源120b模型!OpenAI/国产 终极二选一,速来看实测~

最强开源120b模型!OpenAI/国产 终极二选一,速来看实测~

一直被称为"CloseAI"的OpenAI,终于舍得发布了他们继GPT-2之后的第一个开源模型:GPT-OSS

来自主题: AI产品测评
6203 点击    2025-08-07 17:45
万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

从GPT-2到DeepSeek-V3和Kimi K2,架构看似未变,却藏着哪些微妙升级?本文深入剖析2025年顶级开源模型的创新技术,揭示滑动窗口注意力、MoE和NoPE如何重塑效率与性能。

来自主题: AI技术研报
6255 点击    2025-08-04 12:05
AI圈水太深:OpenAI保密、Meta作弊!国产MoE却异军突起

AI圈水太深:OpenAI保密、Meta作弊!国产MoE却异军突起

AI圈水太深:OpenAI保密、Meta作弊!国产MoE却异军突起

从GPT-2到Llama 4,大模型这几年到底「胖」了多少?从百亿级密集参数到稀疏MoE架构,从闭源霸权到开源反击,Meta、OpenAI、Mistral、DeepSeek……群雄割据,谁能称王?

来自主题: AI技术研报
6318 点击    2025-07-16 16:18
OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI真的要开源了!奥特曼官宣,即将开源自GPT-2以来的首款推理模型,可在消费级硬件上运行。同时,OpenAI又拿到了最高400亿单轮融资,估值直冲3000亿。

来自主题: AI资讯
7240 点击    2025-04-01 10:40
OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

来自主题: AI资讯
8209 点击    2025-04-01 09:15
从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。

来自主题: AI技术研报
8240 点击    2025-01-04 14:20
智平方郭彦东:具身智能到达GPT-2时刻,产业化成败在于“物理世界大模型”工程化能力

智平方郭彦东:具身智能到达GPT-2时刻,产业化成败在于“物理世界大模型”工程化能力

智平方郭彦东:具身智能到达GPT-2时刻,产业化成败在于“物理世界大模型”工程化能力

2024年不愧是“具身智能元年”。 在刚刚结束的第十三届中国创新创业大赛新技术赛道中,一家具身机器人公司脱颖而出,斩获总决赛亚军,跻身全国50强。

来自主题: AI资讯
6491 点击    2024-12-27 12:53