马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用马斯克说到做到: 旗下大模型Grok现已开源
搜索
马斯克说到做到: 旗下大模型Grok现已开源
继2月以投后约25亿美金估值炸场后,杨植麟的大模型公司月之暗面终于有了一次公开对媒体的活动。
说到做到,马斯克承诺的开源版大模型 Grok 终于来了!
AI对字节广告和云业务的影响,比想象中更大。
哈工大联合度小满推出针对多模态模型的自适应剪枝算法 SmartTrim,论文已被自然语言处理顶级会议 COLING 24 接收。
人类设计 prompt 的效率其实很低,效果也不如 AI 模型自己优化。2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。
近日,来自MIT的研究人员发表了关于大模型能力增速的研究,结果表明,LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律!硬件马上就要跟不上啦!
左手融钱,右手投资,还刚刚发布了过去一年与商业化博弈的成果。这就是智谱AI在发布ChatGLM千亿对话模型一周年之际,对外界的一顿狂轰乱炸。
在 AI 落地如何 ToB 业务上,有赞是属于「跑得快」的一批玩家。在 2024 年 1 月 FounderPark 的一场直播中,有赞创始人兼 CEO 白鸦就从 SaaS 产品经理的角度,聊了聊大模型时代的产品应该怎么做。而在最近的一场直播中,白鸦则详细分享了有赞如何用 AI 改造他们的 SaaS 服务流程。
早在 2020 年,陶大程团队就发布了《Knowledge Distillation: A Survey》,详细介绍了知识蒸馏在深度学习中的应用,主要用于模型压缩和加速。随着大语言模型的出现,知识蒸馏的作用范围不断扩大,逐渐扩展到了用于提升小模型的性能以及模型的自我提升。