华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印
华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出:
来自主题: AI资讯
11535 点击 2025-07-07 09:58
搜索
华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出: