大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark还有12款大模型全军覆没……
来自主题: AI资讯
10586 点击 2024-06-25 10:36
还有12款大模型全军覆没……
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。
3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。
针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。