答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思大语言模型(LLM)的迅速发展,引发了关于如何评估其公平性和可靠性的热议。
大语言模型(LLM)的迅速发展,引发了关于如何评估其公平性和可靠性的热议。
通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。
有大视角,才不会被细节迷惑。
AI写了这么多代码,你还应该学习计算机科学吗?新的数据表明,学生们仍然成群结队地在大学里选修计算机:加州大学伯克利分校(UCB)计算机科学专业的一年级申请人数猛增48%!UCB教授分析,AI还没有学会创新,人类软件开发者可以利用AI提质增效。
训练数据的数量和质量,对LLM性能的重要性已经是不言自明的事实。然而,Epoch AI近期的一篇论文却给正在疯狂扩展的AI模型们泼了冷水,他们预测,互联网上可用的人类文本数据将在四年后,即2028年耗尽。
才用了112台A800,就能训出性能达GPT-4 90%的万亿参数大模型?智源的全球首个低碳单体稠密万亿参数大模型Tele-FLM,有望解决全球算力紧缺难题!此外,全新思路的原生多模态「世界模型」Emu 3等都浅亮相了一把。2024的智源大会,依然是星光熠熠,学术巨佬含量超标。
刚刚,英伟达全新发布的开源模型Nemotron-4 340B,有可能彻底改变训练LLM的方式!从此,或许各行各业都不再需要昂贵的真实世界数据集了。而且,Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,甚至可以和GPT-4掰手腕!
万亿美元新增量。
6月5日,AI 视频生成工具 Pika 宣布了它新近完成的 8000万美元 B 轮融资。
在刚刚结束的全球开发者大会上,苹果宣布了 Apple intelligence, 这是一款深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 的全新个性化智能系统。