
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活论老黄卖铲子的技术含量。
论老黄卖铲子的技术含量。
OpenAI全新的AGI路线图,刚刚被曝出了!OpenAI将AI划分为5个等级,自称其AI模型正处于L1,但很快就会达到L2(推理者)。而根据其前研究员预测,五级AGI最快将在27年实现。
《思考快与慢》中人类的两种思考方式,属实是被Meta给玩明白了。
评估大模型是否诚实的基准来了!
大模型权威测试,翻车了?! HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issue提出质疑。
已经与OpenAI合作多年的微软,以及刚刚透露要加入董事会的苹果,这两天突然毫无征兆地宣布放弃董事会观察员席位。难道OpenAI真的要终止合作、决定单飞了?
四大 VLM,竟都在盲人摸象?
全球首个芯片设计开源大模型SemiKong正式发布,基于Llama 3微调而来,性能超越通用大模型。未来5年,SemiKong或将重塑价值5000亿美元的半导体行业。
来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架,简化了原本需要多个模型的复杂的RAG流水线,用微调的方法交给同一个LLM完成,结果同时实现了模型在RAG任务上的性能提升。
WHO 表示,1/3 的癌症可以通过早发现、早治疗得以治愈。