
小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law
小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law不必增加模型参数,计算资源相同,小模型性能超过比它大14倍的模型!
不必增加模型参数,计算资源相同,小模型性能超过比它大14倍的模型!
高端的食材,往往只需要最朴素的烹饪方式;高端的提示词也一样,把Top-K写进来,一个专属于你的CoT-decoding解码策略应运而生!丝毫不要怀疑LLM的推理能力,在这个维度上,它比我们懂!
DeepMind又闷声放大招了!
谷歌DeepMind5月发布的AlphaFold 3同时席卷了生物界和计算机科学界,被认为是「有诺奖潜力的成果」。
在大模型对话框之外,DeepMind 始终坚持做一些独特的工作。
今天,DeepMind又发布了Alpha模型家族的新成员,堪称是「专精版」的AlphaFold,专注于设计蛋白质结合剂,将大幅减少所需的实验室工作,提升开发效率。
DeepMind联合帝国理工学院的学者,专注于用神经网络方法对量子力学中经典的薛定谔方程进行近似求解。继2020年提出FermiNet后,团队的最新成果——求解量子激发态,登上Science。
向大模型输入「Michael Jordan plays the sport of _____(迈克尔・乔丹从事的体育运动是……)」,然后让其预测接下来的文本,那么大模型多半能正确预测接下来是「basketball(篮球)」。
“比Sora还震撼”,AI可以实时生成游戏了!
继5月的文件泄露事件后,谷歌的搜索引擎又被掀了个底朝天。不仅DeepMind发论文解释了Vizier系统的机制,博客作者Mario Fischer还对近百份文档做了彻底的调研分析,为我们还原了这个互联网巨兽的全貌。