AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

世界上最快超算集群Frontier,用8%的GPU训练出了一个万亿级规模的大模型,而且是在AMD硬件平台之上完成。研究人员将训练的细节和克服的困难写成了一篇论文,展示了如何用非英伟达的生态完成大模型训练的技术框架和细节。

来自主题: AI资讯
6430 点击    2024-01-13 20:20
Meta光速下架的模型Galactica,上交大用它构建地球科学大模型

Meta光速下架的模型Galactica,上交大用它构建地球科学大模型

Meta光速下架的模型Galactica,上交大用它构建地球科学大模型

2022年10月30日,ChatGPT的横空出世,仅用几天的时间就改变了包括学术界在内的各行各业的,在OpenAI的成果的光辉下,有一个独特的模型,来自Meta团队的Galactica在ChatGPT三天前上线就被迫下线,这一度成为了LeCun教授的意难平。

来自主题: AI资讯
9871 点击    2024-01-13 13:53
如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术

如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术

如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术

近日,CMU Catalyst 团队推出了一篇关于高效 LLM 推理的综述,覆盖了 300 余篇相关论文,从 MLSys 的研究视角介绍了算法创新和系统优化两个方面的相关进展。

来自主题: AI资讯
5061 点击    2024-01-13 13:49
《西游记》把大模型给难倒了

《西游记》把大模型给难倒了

《西游记》把大模型给难倒了

选择做个人AI计算机,用它补齐大模型和AI应用间缺失的那一环。

来自主题: AI资讯
7984 点击    2024-01-13 13:37
大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

北大团队新作,让大模型拥有个性!而且还是自定义那种,16种MBTI都能选。

来自主题: AI资讯
10654 点击    2024-01-13 13:32
解读AI大模型,从了解token开始

解读AI大模型,从了解token开始

解读AI大模型,从了解token开始

我基于结合大量示例及可视化的图形手段给大家科普了AI大模型的相关算法和核心概念。

来自主题: AI资讯
4163 点击    2024-01-13 11:07
自动驾驶中的AI大模型中有哪些研究方向,与Transformer何干?

自动驾驶中的AI大模型中有哪些研究方向,与Transformer何干?

自动驾驶中的AI大模型中有哪些研究方向,与Transformer何干?

自动驾驶中的大模型处理作为当前 AI 领域最为火热的前沿趋势之一,可赋能自动驾驶领域的感知、标注、仿真训练等多个核心环节。同时,也可以有效的提升感知精确度,有利于后续规划控制算法的实施,促进端到端自动驾驶框架的发展。

来自主题: AI资讯
10417 点击    2024-01-13 10:59
零代码定制游戏NPC,百川智能发布角色大模型

零代码定制游戏NPC,百川智能发布角色大模型

零代码定制游戏NPC,百川智能发布角色大模型

1月9日,百川智能正式发布角色大模型Baichuan-NPC。Baichuan-NPC优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色更加真实生动。

来自主题: AI资讯
10804 点击    2024-01-13 10:56
央企第一家:中国电信开源星辰语义大模型,共享超1T高质基础数据

央企第一家:中国电信开源星辰语义大模型,共享超1T高质基础数据

央企第一家:中国电信开源星辰语义大模型,共享超1T高质基础数据

2024 年伊始,中国电信开源星辰语义大模型-7B,成为第一家开源大模型的央企。同时开源的还有超 1T 的高质量清洗基础数据。

来自主题: AI资讯
7607 点击    2024-01-12 17:45
谁在成为大模型的“AI运营”?

谁在成为大模型的“AI运营”?

谁在成为大模型的“AI运营”?

在过去的一段时间里,“AI-native”成为所有工具的一个显著探索趋势,不论是算力集群的智算中心,还是数据库侧的向量数据库,再或者是不断进化的算法,都在以一种更适配大模型架构的方式被推演出来。

来自主题: AI资讯
11315 点击    2024-01-12 17:36