AI资讯新闻榜单内容搜索-token

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: token
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法:它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。

来自主题: AI技术研报
9098 点击    2024-02-29 13:27
200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

谷歌刚刷新大模型上下文窗口长度记录,发布支持100万token的Gemini 1.5,微软就来砸场子了。

来自主题: AI技术研报
6197 点击    2024-02-24 11:58
ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源​

ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源​

ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源​

ChatGPT突然失去理智,被网友们吵翻了天。许多用户在请求ChatGPT问题时,发现它开始胡言乱语,大篇重复。不一会儿,OpenAI给出官方解释:下一token概率预测相关,目前bug已修复。

来自主题: AI资讯
5941 点击    2024-02-23 14:31
运行LIama2得8400万元!最快AI推理芯片成本推算引热议

运行LIama2得8400万元!最快AI推理芯片成本推算引热议

运行LIama2得8400万元!最快AI推理芯片成本推算引热议

这两天,Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片,实现每秒500tokens大模型生成,感受不到任何延迟。外加谷歌TPU团队这样一个高精尖人才Buff,让不少人直呼:英伟达要被碾压了……

来自主题: AI资讯
2936 点击    2024-02-21 16:39
Karpathy新视频又火了:从头构建GPT Tokenizer

Karpathy新视频又火了:从头构建GPT Tokenizer

Karpathy新视频又火了:从头构建GPT Tokenizer

技术大神卡帕西离职OpenAI以后,营业可谓相当积极啊。

来自主题: AI资讯
9423 点击    2024-02-21 16:34
100万token,一次能分析1小时YouTube视频,「大世界模型」火了

100万token,一次能分析1小时YouTube视频,「大世界模型」火了

100万token,一次能分析1小时YouTube视频,「大世界模型」火了

我们接连被谷歌的多模态模型 Gemini 1.5 以及 OpenAI 的视频生成模型 Sora 所震撼到,前者可以处理的上下文窗口达百万级别,而后者生成的视频能够理解运动中的物理世界,被很多人称为「世界模型」。

来自主题: AI技术研报
6074 点击    2024-02-20 11:24
一次拿下10亿美金融资,杨植麟和月之暗面要放开手脚了

一次拿下10亿美金融资,杨植麟和月之暗面要放开手脚了

一次拿下10亿美金融资,杨植麟和月之暗面要放开手脚了

月之暗面,拿到了中国大模型初创公司自ChatGPT出现至今的最大一笔单轮融资,10亿美元。

来自主题: AI资讯
7185 点击    2024-02-20 10:47
进我的收藏夹吃灰吧:大模型加速超全指南来了

进我的收藏夹吃灰吧:大模型加速超全指南来了

进我的收藏夹吃灰吧:大模型加速超全指南来了

2023 年,大型语言模型(LLM)以其强大的生成、理解、推理等能力而持续受到高度关注。然而,训练和部署 LLM 非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的方法。

来自主题: AI技术研报
3725 点击    2024-02-09 14:05