AI资讯新闻榜单内容搜索-RISEBench

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: RISEBench

GPT-4o-Image仅完成28.9%任务！上海AI实验室等发布图像编辑新基准，360道人类专家严选难题

GPT-4o-Image也只能完成28.9%的任务，图像编辑评测新基准来了！360个全部由人类专家仔细思考并校对的高质量测试案例，暴露多模态模型在结合推理能力进行图像编辑时的短板。

来自主题: AI技术研报

11155 点击 2025-05-31 14:37