
Bengio等人新作:注意力可被视为RNN,新模型媲美Transformer,但超级省内存
Bengio等人新作:注意力可被视为RNN,新模型媲美Transformer,但超级省内存既能像 Transformer 一样并行训练,推理时内存需求又不随 token 数线性递增,长上下文又有新思路了?
既能像 Transformer 一样并行训练,推理时内存需求又不随 token 数线性递增,长上下文又有新思路了?
英伟达股价,盘后首次冲破1000美元大关!
5 月 21 日上午,阿里云在其例行峰会上,意外地释放了大降价的消息:通义千问 GPT-4 级主力模型推理输入价格降至 0.5 元/百万 tokens,直降 97%。
再等等是不是都能用免费的了。
本文讨论了大模型厂商的降价现象,并分析了其背后的技术和商业动机。
对英伟达来说,这世界上的AI模型们生成的tokens越多,它的收入就越多。 5月22日美股盘后,英伟达最新一季度财报(英伟达财年与自然年不同步,2024年1月30日至2025年1月29日为2025财年,此次为2025财年第一季度财报)再次碾压了已经很高的预期。
英伟达财报显示收入和净利大增,AI芯片市场领先。
近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。
通义千问GPT-4级大模型,直接击穿全网底价!就在刚刚,阿里突然放出大招,官宣9款通义大模型降价。
登录就送500w tokens!1块钱 100w tokens!一降再降!!仅需0.0008元/千tokens!