AI资讯新闻榜单内容搜索-LLM

英伟达发射了首个太空AI服务器，H100已上天

11 月 2 日，英伟达首次把 H100 GPU 送入了太空。作为目前 AI 领域的主力训练芯片，H100 配备 80GB 内存，其性能是此前任何一台进入太空的计算机的上百倍。在轨道上，它将测试一系列人工智能处理应用，包括分析地球观测图像和运行谷歌的大语言模型（LLM）。

来自主题: AI资讯

8382 点击 2025-11-04 12:09

让LLM不再话痨，快手HiPO框架来了

当用户向大语言模型提出一个简单问题，比如「单词 HiPPO 里有几个字母 P？」，它却正襟危坐，开始生成一段冗长的推理链：

来自主题: AI技术研报

8647 点击 2025-11-04 10:44

大模型如何准确读懂图表？微软亚研院教它“看、动手、推理”

多模态大模型（MLLM）在自然图像上已取得显著进展，但当问题落在图表、几何草图、科研绘图等结构化图像上时，细小的感知误差会迅速放大为推理偏差。

来自主题: AI技术研报

7281 点击 2025-11-03 14:20

港科提出新算法革新大模型推理范式：随机策略估值竟成LLM数学推理「神操作」

论文第一作者何浩然是香港科技大学博士生，研究方向包括强化学习和基础模型等，研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计

来自主题: AI技术研报

8496 点击 2025-11-01 09:24

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

8860 点击 2025-11-01 09:23

让 AI 开口「像人」：最难的不是智能，是「嗓音」

Voice Agent 赛道正在爆发，但它迫切需要一个能让对话真正「流动起来」的底层引擎，一个能撑起下一代交互体验的 TTS 模型。竞争的焦点，已经从 LLM 的「大脑」，延伸到了 TTS 的「嗓音」。谁掌握嗓音，谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型，似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯

8549 点击 2025-10-31 15:35