
Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定
Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。
AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。
在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构LAION的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了LLM基准测试的盲区。
最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。
最近,WSJ的一篇文章深度披露了Sam Altman十几年来建立的庞大投资帝国,让我们终于理解了他为什么可以不要OpenAI的股权。但文章同时指出,奥特曼的个人投资和OpenAI的业务存在各种复杂的利益关系。
近期,由清华大学自然语言处理实验室联合面壁智能推出的全新开源多模态大模型 MiniCPM-Llama3-V 2.5 引起了广泛关注
阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强。
OpenAI自研芯片的计划终于看到了实质性进展。根据SemiAnalysis最近的一篇文章,他们正从谷歌TPU团队招募人才,扩展自己的芯片研发组。
开源大模型全球格局,一夜再变。
OpenAI研究如何破解GPT-4思维,公开超级对齐团队工作,Ilya Sutskever也在作者名单之列。