AI狼人杀终极决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背
AI狼人杀终极决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背我真栓Q了!围观了场狼人杀,看得我汗流浃背……
来自主题: AI资讯
6576 点击 2025-12-23 15:25
我真栓Q了!围观了场狼人杀,看得我汗流浃背……
一群AI玩狼人杀,GPT-5断崖式领先,胜率达到了惊人的96.7%。 OpenAI的总裁格雷格·布罗克曼转发了这样的一个基准测试:让7个强大的LLMs,包括开源和闭源,玩了210场完整的狼人杀。
技术节早就不是走过场的科技圈装饰品了。 放眼中外,谁家技术底子硬、AI方向稳,基本都要拿一场技术节出来亮家底。
这是一次「反向图灵测试」,几个全球最先进的大模型坐在一起,坐着火车唱着歌,但其中混进了人类:而 AI 的任务,是把这个人类揪出来。