Llama提速500%!谷歌美女程序员手搓矩阵乘法内核
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度提高了500%!
近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度提高了500%!
近期,百度在大模型领域的动作引人注目,先是有外媒爆料称,百度与苹果达成合作,将为国行版的 iPhone16、Mac 系统和 iOS 18 提供生成式 AI 功能。紧接着又是官宣优必选的人形机器人 WalkerS 接入百度文心大模型。
离大谱了,弱智吧登上正经AI论文,还成了最好的中文训练数据??
苹果公司发布了一款参数量仅为80M的最新模型——ReALM,能够将各种形式的上下文转换为文本进行理解,包括解析屏幕、多轮对话以及上下文引用,提升了Siri等智能助手的反应速度和智能程度。
时光游戏里总是充满了很多奇妙的“巧合”。1787年,莫扎特发明了一个音乐骰子游戏。游戏道具是176条小步舞曲小节,96条三重奏小节,两张写满数字的规则表,两颗骰子。
3 月 28 日,云天励飞举办 AI 大模型产品发布会,发布“深目”AI 模盒,同时宣布自研大模型“云天天书-2.0-68B”版本免费向合作伙伴开放。
2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发展带来了巨大困难。面对这一挑战,原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2],带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩,将微调技术带进千家万户。
没有谁能一直称王,但加上前缀谁都有称王的机会。AI 文生图,还能玩出什么新花样?在这片群雄割据的红海,头部被 Midjourney、DALL·E、Stable Diffusion 等占据,其余还能让人眼前一亮的产品并不多。然而,仍有黑马杀出:Ideogram,前 Google 工程师创立,硅谷 AI 大神投资,去年 8 月面世,2 月底发布了最新的模型。
过去一年,AI大模型技术飞速发展,如何用好大模型实现降本增效、推动业务增长,成为了企业真正关心的问题。据Gartner预测,2026年,将有超过80%企业会使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用,产业发展迎来巨大的机遇与挑战。
【新智元导读】炸裂消息!据外媒透露,微软和OpenAI正豪掷超千亿美元,欲打造一台「星际之门」超算。最快在2028年,「星际之门」就要启动了。而它对电力的需求,将达到前所未有的程度。