AI资讯新闻榜单内容搜索-开源模型

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

因为 V3 版本开源模型的发布，DeepSeek 又火了一把，而且这一次，是外网刷屏。训练成本估计只有 Llama 3.1 405B 模型的 11 分之一，后者的效果还不如它。

来自主题: AI资讯

8726 点击 2025-01-09 09:31

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。

来自主题: AI资讯

10076 点击 2025-01-04 15:15

DeepSeek V3获竞技场最强开源认证！与Claude 3.5 Sonnet对比实测来了

国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini（总榜第7），获最强开源模型认证（也是唯一闯入前10的开源模型）。

来自主题: AI资讯

8422 点击 2024-12-31 14:49

又是来自浙大，“大模型届的拼多多”要刺破英伟达泡沫？

一个来自中国的开源模型，让整个AI圈再次惊呼“来自东方的神秘力量”。昨天，国内知名大模型创业公司“深度求索”通过官方公众号宣布上线并同步开源 DeepSeek-V3模型，并公布了长达53页的训练和技术细节。

来自主题: AI资讯

9128 点击 2024-12-29 10:50

大家都说通义大模型好，究竟好在哪？

都说国产大模型“通义千问”能打，到底是真强还是智商税？今天就带你看看，这个国产“AI猛将”凭什么火出圈！ 2023年4月，阿里巴巴推出通义千问，选择了“全开源”的策略，成为全球开发者关注的焦点。而在2024年的云栖大会上，阿里云进一步发布了Qwen2.5系列，包括多个尺寸的大语言模型、多模态模型、数学模型和代码模型，涵盖从0.5B到72B的完整规模

来自主题: AI资讯

11105 点击 2024-12-25 08:52