AI资讯新闻榜单内容搜索-开源大模型

速递｜初创公司Arcee AI低成本六个月训练，发布4000亿参数开源大模型Trinity

行业内许多人认为AI 模型市场的赢家早已确定：大型科技公司将主导市场（谷歌、Meta、微软，以及部分亚马逊业务）并联合其选择的模型开发商，主要是 OpenAI 和 Anthropic。

来自主题: AI资讯

9366 点击 2026-01-30 16:12

这家西方开源大模型公司，开源出了DeepSeek-V3背后的架构！头部模型表现都差不多了，Mistral CEO自曝如何赚钱

面对《the Big Technology Podcast》抛出的问题，Mistral AI的 CEO Arthur Mensch 表示：大模型肯定会走向商品化，当模型表现越来越接近，那么竞争就不在于模型本身，而在于如何让客户用起来。

来自主题: AI资讯

8116 点击 2026-01-19 18:20

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

提高大模型记忆这块儿，美国大模型开源王者——英伟达也出招了。

来自主题: AI技术研报

8299 点击 2026-01-14 15:29

把RoPE扔掉，AI更能看懂长上下文！Transformer作者团队开源大模型预训练新方法

针对大模型长文本处理难题，Transformer架构的核心作者之一Llion Jones领导的研究团队开源了一项新技术DroPE。

来自主题: AI资讯

7731 点击 2026-01-14 10:49

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

新年刚至，陈天桥携手代季峰率先打响开源大模型的第一枪。

来自主题: AI技术研报

8746 点击 2026-01-06 16:50

深度｜吴恩达：中国在开源权重模型的发布方面已经远远领先于美国；很多人用Agentic AI的方式是错的

如果一项任务主要涉及文本处理，并且你拥有完善的数据渠道，能够获取完成该任务所需的全部文本信息，那么人工智能完成这项任务的难度就会较低。

来自主题: AI资讯

10326 点击 2025-12-29 15:04

超越谷歌，全球第一！上交AI科学家王者归来，登顶OpenAI MLE-bench

刚刚，由SciMaster团队推出的AI机器学习专家ML-Master 2.0，基于国产开源大模型DeepSeek，在OpenAI权威基准测试MLE-bench中一举击败Google、Meta、微软等国际顶流，刷新全球SOTA，再次登顶！目前该功能已在SciMaster线上平台开放waiting list，欢迎申请体验。

来自主题: AI技术研报

6646 点击 2025-12-25 14:22