AI资讯新闻榜单内容搜索-GPT-4o

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT-4o
这个最懂人心的爆火 AI 也要倒下了?

这个最懂人心的爆火 AI 也要倒下了?

这个最懂人心的爆火 AI 也要倒下了?

Character AI 也要走上 Stability AI 的老路了?

来自主题: AI资讯
4274 点击    2024-07-03 14:37
「一夜颠覆世界」的 AI ,到底改变了什么

「一夜颠覆世界」的 AI ,到底改变了什么

「一夜颠覆世界」的 AI ,到底改变了什么

AI 产品刷屏后,你的工作和生活是否因此发生了一些变化。

来自主题: AI资讯
8253 点击    2024-07-02 10:55
豆包文科成绩超了一本线,为什么理科不行?

豆包文科成绩超了一本线,为什么理科不行?

豆包文科成绩超了一本线,为什么理科不行?

什么?好多大模型的文科成绩超一本线,还是最卷的河南省???

来自主题: AI资讯
9451 点击    2024-07-01 15:22
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。

来自主题: AI资讯
8456 点击    2024-07-01 12:21
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。 最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,仅次于 GPT-4o(69.9)和 Claude3.5-Sonnet(67.9)。

来自主题: AI资讯
7454 点击    2024-06-29 00:19
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。

来自主题: AI技术研报
7432 点击    2024-06-29 00:14
陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

Claude 3.5 Sonnet的图表推理能力,比GPT-4o高出了27.8%。 针对多模态大模型在图表任务上的表现,陈丹琦团队提出了新的测试基准。 新Benchmark比以往更有区分度,也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报
8558 点击    2024-06-29 00:07
首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次

首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次

首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次

近日,首个多模态LLM视频分析综合评估基准Video-MME诞生!在这场全新的考试中,Gemini 1.5 Pro一路遥遥领先,谷歌首席科学家Jeff Dean更是愉快地连续转了3次推。

来自主题: AI资讯
4171 点击    2024-06-28 16:24
首次引入GPT-4o!图像自动评估新基准来啦

首次引入GPT-4o!图像自动评估新基准来啦

首次引入GPT-4o!图像自动评估新基准来啦

面对层出不穷的个性化图像生成技术,一个新问题摆在眼前:缺乏统一标准来衡量这些生成的图片是否符合人们的喜好。对此,来自清华、西交大、伊利诺伊厄巴纳-香槟分校、中科院、旷视的研究人员共同推出了一项新基准DreamBench++。

来自主题: AI技术研报
8757 点击    2024-06-27 17:18