AI资讯新闻榜单内容搜索-transforme

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: transforme

树莓派上流畅运行大模型！让终端具备自主学习与记忆能力｜对话RockAI CEO刘凡平

树莓派上流畅运行大模型！让终端具备自主学习与记忆能力｜对话RockAI CEO刘凡平

树莓派上流畅运行大模型！让终端具备自主学习与记忆能力｜对话RockAI CEO刘凡平

他们打造的端侧大模型已经可以在树莓派这样的微型设备上流畅运行，首批搭载Yan架构大模型的具身智能机器人也已经面世。当下AI算力竞赛愈演愈烈之际，他们的“低算力”“群体智能”之路正在获得更多关注。本期「大模型创新架构」主题访谈，量子位邀请到RockAI CEO刘凡平，聊聊他们选择非Transformer架构路线背后的故事，以及通过架构及算法创新实现AGI的技术愿景。

来自主题: AI资讯

9551 点击 2025-04-27 10:14

OpenAI、谷歌等一线大模型科学家公开课，斯坦福CS 25春季上新！

OpenAI、谷歌等一线大模型科学家公开课，斯坦福CS 25春季上新！

OpenAI、谷歌等一线大模型科学家公开课，斯坦福CS 25春季上新！

在斯坦福，有一门专门讲 Transformer 的课程，名叫 CS 25。

来自主题: AI资讯

7453 点击 2025-04-26 19:37

喝点VC｜a16z重磅预测：AI虚拟人将孕育众多市值达数十亿美元的行业巨头

喝点VC｜a16z重磅预测：AI虚拟人将孕育众多市值达数十亿美元的行业巨头

喝点VC｜a16z重磅预测：AI虚拟人将孕育众多市值达数十亿美元的行业巨头

AI虚拟人模型架构从CNN、GANs演进至Transformer+扩散模型，实现从单一面部驱动到半身/全身动态生成的跨越，口型同步与多模态协同表现显著提升。

来自主题: AI资讯

8787 点击 2025-04-23 15:17

Transformer原作打脸DeepSeek观点？一句Wait就能引发反思，RL都不用

Transformer原作打脸DeepSeek观点？一句Wait就能引发反思，RL都不用

Transformer原作打脸DeepSeek观点？一句Wait就能引发反思，RL都不用

Transformer作者Ashish Vaswani团队重磅LLM研究！简单指令：「Wait，」就能有效激发LLM显式反思，表现堪比直接告知模型存在错误。

来自主题: AI技术研报

7885 点击 2025-04-23 10:47

「全球首个自回归视频生成大模型」，刚刚，Swin Transformer作者创业团队重磅开源！

「全球首个自回归视频生成大模型」，刚刚，Swin Transformer作者创业团队重磅开源！

「全球首个自回归视频生成大模型」，刚刚，Swin Transformer作者创业团队重磅开源！

视频生成领域，又出现一位重量级开源选手。

来自主题: AI资讯

8007 点击 2025-04-22 19:24

AI版本宝可梦冲榜上全球前10%！一次性「吃掉」10年47.5万场人类对战数据

AI版本宝可梦冲榜上全球前10%！一次性「吃掉」10年47.5万场人类对战数据

AI版本宝可梦冲榜上全球前10%！一次性「吃掉」10年47.5万场人类对战数据

还在用搜索和规则训练AI游戏？现在直接「看回放」学打宝可梦了！德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体，不靠规则、没用启发式算法，纯靠47.5万场人类对战回放训练出来，居然打上了Pokémon Showdown全球前10%！

来自主题: AI技术研报

9778 点击 2025-04-20 22:19

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

Nemotron-H模型混合了Transformer和Mamba架构，使长文本推理速度提升3倍，同时还能保持高性能，开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术，进一步提高了20%推理速度

来自主题: AI产品测评

8588 点击 2025-04-20 20:47

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

基于Transformer的自回归架构在语言建模上取得了显著成功，但在图像生成领域，扩散模型凭借强大的生成质量和可控性占据了主导地位。

来自主题: AI技术研报

8561 点击 2025-04-19 15:01

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

4 月 14 日，谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲，主题为「AI 的重要趋势：我们是如何走到今天的，我们现在能做什么，以及我们如何塑造 AI 的未来？」

来自主题: AI技术研报

8208 点击 2025-04-18 14:40

MiniMax押注线性注意力，让百万级长文本只用1/2700算力｜对话MiniMax-01架构负责人钟怡然

MiniMax押注线性注意力，让百万级长文本只用1/2700算力｜对话MiniMax-01架构负责人钟怡然

MiniMax押注线性注意力，让百万级长文本只用1/2700算力｜对话MiniMax-01架构负责人钟怡然

Transformer架构主导着生成式AI浪潮的当下，但它并非十全十美，也并非没有改写者。

来自主题: AI技术研报

8578 点击 2025-04-17 15:29

上一页当前第11页,共40页下一页