AI资讯新闻榜单内容搜索-模型

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

仅用32B，就击败o1-mini追平671B满血版DeepSeek-R1！阿里深夜重磅发布的QwQ-32B，再次让全球开发者陷入狂欢：消费级显卡就能跑，还一下子干到推理模型天花板！

来自主题: AI技术研报

7847 点击 2025-03-07 10:28

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络（Multi-head Latent Attention, MLA）是其经济推理架构的核心之一，通过对键值缓存进行低秩压缩，显著降低推理成本 [1]。

来自主题: AI技术研报

7016 点击 2025-03-07 10:24

腾讯元宝用户协议“三次变脸”，AI生成的内容归属于谁？

腾讯AI助手腾讯元宝APP近期修改用户协议内容一事引发关注，成为热搜。焦点是使用AI应用或者产品的用户上传和生成内容的权利归属问题。自2月以来，有网友发现腾讯元宝的用户服务协议中，知识产权和其他权利的部分，包括了用户上传的内容，以及用元宝大模型生成的内容。

来自主题: AI资讯

12218 点击 2025-03-07 10:15

GPT 5/o3欠拟合与过拟合详细分析与深度思考(三万字超长洞察，慎入)

当模型复杂度增加到一定程度后，模型开始对训练数据中的噪声和异常值进行拟合，而不是仅仅学习数据中的真实模式。这导致模型在训练数据上表现得非常好，但在新的数据上表现不佳，因为新的数据中噪声和异常值的分布与训练数据不同。

来自主题: AI技术研报

13140 点击 2025-03-06 23:31

司南首期多模态模型闭源榜单发布！48个模型同台竞技，谁将脱颖而出？

基于闭源评测基准，近期司南针对国内外主流多模态大模型进行了全面评测，现公布司南首期多模态模型闭源评测榜单。首期榜单共包含 48 个多模态模型，其中包含：3 个国内 API 模型：GLM-4v-Plus-20250111 (智谱)，Step-1o (阶跃)，BailingMM-Pro-0120 (蚂蚁)

来自主题: AI技术研报

11966 点击 2025-03-06 19:45