
AI 投资 | 硅谷风投Sapphire,AI进入调整期,但长期坚定看好
AI 投资 | 硅谷风投Sapphire,AI进入调整期,但长期坚定看好今天,生成式AI已成为技术和金融市场中的重要话题。无论是通过风险投资、股票上涨、媒体报道,还是财报电话会议中的提及次数来衡量,AI的崛起都是显而易见的。
今天,生成式AI已成为技术和金融市场中的重要话题。无论是通过风险投资、股票上涨、媒体报道,还是财报电话会议中的提及次数来衡量,AI的崛起都是显而易见的。
轻量级模型的春天要来了吗?
微软Phi 3.5系列上新了!mini模型小而更美,MoE模型首次亮相,vision模型专注多模态。
面对GenAI的技术浪潮,很多人都会在不断迭代更新的技术中逐渐迷失。站在潮头的Sapphire、Emergence、Menlo等风投公司,又会如何看待这场AI变局的现状与走向?
Build大会召开两周之后,微软更新了Phi-3系列模型的技术报告。不仅加入最新的基准测试结果,而且对小模型、高性能的实现机制做出了适当的揭示。
深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。
过去几年,借助Scaling Laws的魔力,预训练的数据集不断增大,使得大模型的参数量也可以越做越大,从五年前的数十亿参数已经成长到今天的万亿级,在各个自然语言处理任务上的性能也越来越好。
当前最火的大模型,竟然三分之二都存在过拟合问题?
大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophic values)等问题,目前模型的上下文窗口大多不超过128k个token
从Llama 3到Phi-3,蹭着开源热乎劲儿,苹果也来搞事情了。