字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA
字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA利用字节团队魔改的FLUX模型,可以直接把多个参考主体放进一张图了。
来自主题: AI技术研报
9081 点击 2025-04-10 15:15
利用字节团队魔改的FLUX模型,可以直接把多个参考主体放进一张图了。
要知道,过去几年,各种通用评测逐渐同质化,越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准,各家模型出街时人手一份,但局限性也开始暴露,比如覆盖范围狭窄(通常不足 50 个学科),不含长尾知识;缺乏足够挑战性和区分度,比如 GPT-4o 在 MMLU-Pro 上准确率飙到 92.3%。
随着深度学习大语言模型的越来越火爆,大语言模型越做越大,使得其推理成本也水涨船高。模型量化,成为一个热门的研究课题。
两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画,引起了网友的热议。