
从零手搓MoE大模型,大神级教程来了
从零手搓MoE大模型,大神级教程来了Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。
Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。
作为全球最顶级的机器学习工具库,Hugging Face上最近悄悄出现了一个新的transformers模型——Qwen2。没错,正是阿里通义千问Qwen模型的第二代。不过通义团队的算法同学在社交媒体上对此继续保持神秘。
Gradio CEO 兼联合创始人 Abubakar Abid 谈了谈 Gradio 被收购的内幕故事。
2023 年,是机器学习和人工智能发展最为迅速的一年,这里分享 10 篇最值得关注的论文。
10年前,「地震预测」在圈内还是如尼斯湖水怪一般的奇谈怪论,但机器学习的发展,已经让「准确预测地震」的可能性,又往前迈进了一步。
苹果新发布适用于苹果芯片的机器学习框架MLX,MLX是一个类似于NumPy的阵列框架,旨在为使用苹果硬件的研究人员简化 ML 模型的训练和部署。
在数字化建设不断推进的今天,随着技术的不断发展,从统计学、机器学习、深度学习,再到因果学习以及最新的热门大模型方向,九章云极 DataCanvas 始终紧贴最前沿的、最能助力企业和落地实践的方向,不断进行着面向决策和面向智能的探索。本文将分享大模型时代下的因果推断。
对于人工智能,披头士团队却讳莫如深。尽管新歌《Now and Then》的纪录片里提到机器学习,但自始至终,AI字样并没有出现在纪录片的文案中,而且,保罗·麦卡特尼强调歌曲中“没有任何东西是人工或合成创造出来的”,制作人贾尔斯·马丁则坚称歌曲没有使用AI。
EMNLP顶会落下帷幕,各种奖项悉数颁出。最佳长论文奖被北大微信AI团队收入囊中,由北大孙栩老师和微信周杰、孟凡东合作指导。
苹果M系列芯片专属的机器学习框架,开源即爆火!现在,用上这个框架,你就能直接在苹果GPU上跑70亿参数大模型、训练Transformer模型或是搞LoRA微调。