AI资讯新闻榜单内容搜索-LAM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LAM
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B + RAG 方案快 36 倍。

来自主题: AI技术研报
7359 点击    2024-04-07 17:44
OpenAI 核心创始成员Andrej:让大模型像人脑一样低功耗运行

OpenAI 核心创始成员Andrej:让大模型像人脑一样低功耗运行

OpenAI 核心创始成员Andrej:让大模型像人脑一样低功耗运行

关注 OpenAI核心创始成员Andrej Karpathy 深度分享AI大模型发展及Elon管理法则。近日,OpenAI核心创始成员Andrej Karpathy(已于24年2月离职)在红杉资本进行了一场精彩的分享。

来自主题: AI资讯
6434 点击    2024-04-07 13:09
10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观

10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观

10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观

“只需”10万美元,训练Llama-2级别的大模型。尺寸更小但性能不减的MoE模型来了:它叫JetMoE,来自MIT、普林斯顿等研究机构。性能妥妥超过同等规模的Llama-2。

来自主题: AI技术研报
7233 点击    2024-04-05 17:13
华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果,然而,Transformer 中自注意力带来的二次复杂度使得大模型的推理成本和内存占用十分巨大,特别是在长序列的场景中。

来自主题: AI技术研报
4790 点击    2024-04-03 17:29
长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免

长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免

长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免

Anthropic 发现一种新型越狱漏洞并给出了高效的缓解方案,可以将攻击成功率从 61% 降至 2%。

来自主题: AI技术研报
6970 点击    2024-04-03 17:16
多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水——Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。无论是闭源的GPT-4和Claude 2,还是开源的Llama2和Mistral,都未能幸免。

来自主题: AI技术研报
7295 点击    2024-04-03 14:31
全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

【新智元导读】就在刚刚,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!这个过程只用了2个月,1000万美元,和3100块H100。

来自主题: AI技术研报
7685 点击    2024-03-28 16:09
4万亿晶体管5nm制程,全球最快AI芯片碾压H100!单机可训24万亿参数LLM,Llama 70B一天搞定

4万亿晶体管5nm制程,全球最快AI芯片碾压H100!单机可训24万亿参数LLM,Llama 70B一天搞定

4万亿晶体管5nm制程,全球最快AI芯片碾压H100!单机可训24万亿参数LLM,Llama 70B一天搞定

AI世界的进化快的有点跟不上了。刚刚,全球最强最大AI芯片WSE-3发布,4万亿晶体管5nm工艺制程。更厉害的是,WSE-3打造的单个超算可训出24万亿参数模型,相当于GPT-4/Gemini的十倍大。

来自主题: AI资讯
9083 点击    2024-03-15 12:34