AI资讯新闻榜单内容搜索-GPT-4o

Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。

来自主题: AI技术研报

9266 点击 2024-06-29 00:14

Claude 3.5 Sonnet的图表推理能力，比GPT-4o高出了27.8%。针对多模态大模型在图表任务上的表现，陈丹琦团队提出了新的测试基准。新Benchmark比以往更有区分度，也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报

10837 点击 2024-06-29 00:07

近日，首个多模态LLM视频分析综合评估基准Video-MME诞生！在这场全新的考试中，Gemini 1.5 Pro一路遥遥领先，谷歌首席科学家Jeff Dean更是愉快地连续转了3次推。

来自主题: AI资讯

5210 点击 2024-06-28 16:24

面对层出不穷的个性化图像生成技术，一个新问题摆在眼前：缺乏统一标准来衡量这些生成的图片是否符合人们的喜好。对此，来自清华、西交大、伊利诺伊厄巴纳-香槟分校、中科院、旷视的研究人员共同推出了一项新基准DreamBench++。

来自主题: AI技术研报

9929 点击 2024-06-27 17:18

GPT-4o二折平替千亿国产大模型出海！刚刚，全球头部模型托管平台Fireworks AI宣布了最新消息。这是继登陆英伟达官网之后，Yi-Large再次入驻美国主流平台。

来自主题: AI资讯

11704 点击 2024-06-27 16:41

今天凌晨，OpenAI官方账号宣布，ChatGPT MAC版本桌面应用程序今日起向公众免费开放使用，但原定于6月底向Plus用户开放的语音功能将推迟一个月上线，据悉这是出于安全因素和用户体验的保证。

来自主题: AI资讯

6707 点击 2024-06-26 17:23

爆款AI应用，还未现身

来自主题: AI资讯

8093 点击 2024-06-25 09:33

参加 2024 河南高考，豆包和文心 4.0 过了一本线，但比 GPT-4o 还差点。

来自主题: AI资讯

6374 点击 2024-06-25 09:30

AI技术日新月异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论

来自主题: AI技术研报

11394 点击 2024-06-24 15:49

5月中旬，OpenAI发布了全新的ChatGPT-4o，并邀请初代在线教育顶流可汗教育（Khan Academy）创始人Sal Khan出题、出提示词，让这款全新的4o来教他儿子做几何题。

来自主题: AI资讯

8223 点击 2024-06-24 15:39