用「图灵测试」检验AI尤其是大语言模型,真的科学吗?
用「图灵测试」检验AI尤其是大语言模型,真的科学吗?当前的大型语言模型似乎能够通过一些公开的图灵测试。我们该如何衡量它们是否像人一样聪明呢?
来自主题: AI技术研报
6470 点击 2024-08-31 10:05
当前的大型语言模型似乎能够通过一些公开的图灵测试。我们该如何衡量它们是否像人一样聪明呢?
大模型的拟人行为,在让我们产生恐怖谷效应。
最近,一位AI炒菜机器人不仅向人类大厨发起了PK,而且还通过了「图灵测试」:根本吃不出来是AI机器人炒的!而在这背后,竟然是1.5个亿的投入和近7吨菜的训练。
你敢相信?ChatGPT已经通过图灵测试了!
怎么度量现在的AI到底能干什么不能干什么?
GPT-4通过图灵测试,54%人误认为真人。
未来5年内会在AI技术架构上有大的突破,Transformer会被逐步重构。15-20年内实现通用人工智能(AGI),并通过“新图灵测试”。
这是一次「反向图灵测试」,几个全球最先进的大模型坐在一起,坐着火车唱着歌,但其中混进了人类:而 AI 的任务,是把这个人类揪出来。
GPT-4可以通过图灵测试吗?
GPT-4无法通过图灵测试!UCSD团队研究证明60年前AI在测试中打败了ChatGPT,更有趣的是人类在测试中的胜率仅有63%。