创业:大模型RAG系统三个月的开发心得和思考
创业:大模型RAG系统三个月的开发心得和思考自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,这中间有一个春节,前后的总时间大概是三个月左右,在这三个月期间,基本是昼夜兼程啊,到今天3月底结束,产品目前看是有了一个基础的雏形。
搜索
自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,这中间有一个春节,前后的总时间大概是三个月左右,在这三个月期间,基本是昼夜兼程啊,到今天3月底结束,产品目前看是有了一个基础的雏形。
在上一篇文章「Unsloth微调Llama3-8B,提速44.35%,节省42.58%显存,最少仅需7.75GB显存」中,我们介绍了Unsloth,这是一个大模型训练加速和显存高效的训练框架,我们已将其整合到Firefly训练框架中,并且对Llama3-8B的训练进行了测试,Unsloth可大幅提升训练速度和减少显存占用。
首位中国学者,成功入选「计算机图形学名人堂」!
两周前,OpenBMB开源社区联合面壁智能发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。
大模型又又又被曝出安全问题!
开源大模型领域,又迎来一位强有力的竞争者。
最新国产开源MoE大模型,刚刚亮相就火了。
AI发展驱动收入增长,但成本激增需大投资。
事实是:基于大语言模型的AI应用创业是地狱难度。我认为可能半年内大部分纯做大语言模型应用的AI创业公司都会死掉。
苹果高管还在社交媒体暗示本次WWDC将有人工智能(AI)要素,有分析认为,这将会是iPhone历史上最雄心勃勃的一次软件升级。这导致近几个月,有关苹果iOS 18操作系统会如何集成AI功能的讨论不绝于耳。