112页报告深挖GPT-4V!UCLA等发布全新「多模态数学推理」基准MathVista
112页报告深挖GPT-4V!UCLA等发布全新「多模态数学推理」基准MathVista大型多模态模型会做数学题吗?在UCLA等机构最新发布的MathVista基准上,即使是当前最强的GPT-4V也会感到「挫败感」。
来自主题: AI资讯
10122 点击 2023-12-05 17:15
大型多模态模型会做数学题吗?在UCLA等机构最新发布的MathVista基准上,即使是当前最强的GPT-4V也会感到「挫败感」。
专门为AI设立的IMO国际奥林匹克数学竞赛来了—
今天,智谱AI开源其第三代基座大语言模型ChatGLM3-6B,官方说明该模型的性能较前一代大幅提升,是10B以下最强基础大模型!
阿里目前再次开源全新的Qwen-14B的模型,参数规模142亿,但是它的理解能力接近700亿参数规模的LLaMA2-70B,数学推理能力超过GPT-3.5。