
北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快
北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快批评不仅能让人进步,也能让大模型的能力提升。
批评不仅能让人进步,也能让大模型的能力提升。
或许只有用大模型来监督大模型,才能出现超越人类的人工智能。
全球首款AI短剧APP「Reel.AI」发布,获百度投资。
今天,OpenAI悄悄在博客上发布了一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。
是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?
如何制服AI吞电兽? 这两天,Computex上演了一出“神仙打架”的戏码,英伟达、英特尔、AMD、高通、Supermicro、恩智浦等厂商的演讲一个比一个重磅。可以说,基本上所有的终端都已经被AI所加持,人们页感叹,全民AI时代,真的来了。
CRATE-α是一种新型Transformer架构变体,通过设计改进提升了模型的可扩展性、性能和可解释性,CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型,其性能会随着模型和数据集规模扩大而继续提升。
多家 AI 硬件公司的产品如 Ai Pin 、Rabbit 陆续发布,AI 硬件的关注度也日益提升,而关于 Ai Pin 的争议评论,也让不少人开始对 AI 硬件的产品和商业模式进行讨论和反思。
通过提示查询生成模块和任务感知适配器,大一统框架VimTS在不同任务间实现更好的协同作用,显著提升了模型的泛化能力。该方法在多个跨域基准测试中表现优异,尤其在视频级跨域自适应方面,仅使用图像数据就实现了比现有端到端视频识别方法更高的性能。
昨天发的一篇文章,讲的是用 Midjourney 加 Kimi 做一款像素游戏。发完后,朋友看到说:“这他妈是游戏嘛,这跟你儿子学的 Scratch 做的游戏有什么区别?”我当时听到很不服气,怎么能把我跟儿子比呢,我吃的盐比他吃的饭还多呢。