AI资讯新闻榜单内容搜索-SPO

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

全球首个1毫秒级人体动作捕捉系统FlashCap，通过闪烁LED与事件相机结合，实现1000Hz超高帧率捕捉。无需昂贵设备或强光环境，低成本穿戴服即可精准捕捉极速动作。团队同步开源715万帧的FlashMotion数据集与多模态模型ResPose，显著提升运动分析精度，推动体育、VR与机器人领域迈向高动态智能新阶段。

来自主题: AI技术研报

6898 点击 2026-03-31 14:40

刚刚，OpenAI自曝：内部如何把“最新GPT模型”改造成“长时程干活智能体”！

今天是 OpenAI Responses API 上线一周年。OpenAI 又出来抖猛料了！

来自主题: AI资讯

9279 点击 2026-03-12 14:51

ICLR 2026 | SEINT：高效的跨空间刚体不变度量

本文提出一种具有 SE(p) 不变传输性质的度量 SEINT：通过构造无需训练的 SE(p) 不变表示，将高维结构信息压缩为可用于 Optimal Transport (OT) 对齐的一维表征，从而在保持不变性与严格度量性质的同时显著提升效率。

来自主题: AI技术研报

6590 点击 2026-02-18 13:28

速递｜高通800万美元投资AI合同审阅平台SpotDraft，可完全离线处理数据，半年内估值翻倍

随着无需向云端发送敏感数据、以隐私为先的企业级人工智能需求日益增长，SpotDraft 已从高通风险投资公司获得 800 万美元战略 B 轮扩展融资，以扩展其面向受监管法律工作流程的端侧合同审评技术。

来自主题: AI资讯

10974 点击 2026-01-28 15:32

国产Nano Banana开源！用华为AI芯片训练，1张图只要1毛钱

今天，首个在国产芯片上完成全程训练的SOTA（最佳水平）多模态模型开源。这是智谱联合华为开源的图像生成模型GLM-Image。从数据到训练的全流程，该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。

来自主题: AI资讯

10878 点击 2026-01-14 14:09

AI体育教练来了！中国团队打造SportsGPT，完成从数值评估到专业指导的智能转身

在AI席卷各行各业的今天，体育圈的“智能化”走到哪一步了？

来自主题: AI技术研报

8104 点击 2025-12-22 16:40

真乐队退出，但 AI 冒牌却在 Spotify「拼好歌」冲榜

他们的歌迷最近却发现了一支名为「King Lizard Wizard」的假乐队。上传的歌曲标题、歌词都逐字照搬 King Gizzard 的原作，甚至连歌曲名称都一模一样（比如冒牌乐队的《Rattlesnake》直接盗用原曲名和歌词）。用户在 Spotify 搜索「King Gizzard」时，会发现乐队已弃用的官方账号，

来自主题: AI资讯

8884 点击 2025-12-10 14:39

NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速

当前，视频生成模型性能正在快速提升，尤其是基于Transformer架构的DiT模型，在视频生成领域的表现已经逐渐接近真实拍摄效果。然而，这些扩散模型也面临一个共同的瓶颈：推理时间长、算力成本高、生成速度难以提升。随着视频生成长度持续增加、分辨率不断提高，这个瓶颈正在成为影响视频创作体验的主要障碍之一。

来自主题: AI技术研报

8679 点击 2025-11-26 13:46

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

在视觉处理任务中，Vision Transformers（ViTs）已发展成为主流架构。然而，近期研究表明，ViT 模型的密集特征中会出现部分与局部语义不一致的伪影（artifact），进而削弱模型在精细定位类任务中的性能表现。因此，如何在不耗费大量计算资源的前提下，保留 ViT 模型预训练核心信息并消除密集特征中的伪影？

来自主题: AI技术研报

8564 点击 2025-11-20 09:33

NeurIPS 2025 Spotlight | NYU提出QSVD，仅数学压缩让模型更轻、更快、更稳

在多模态智能浪潮中，视觉语言模型（Vision-Language Models, VLM）已成为连接视觉理解与语言生成的核心引擎。从图像描述、视觉问答到 AI 教育和交互系统，它们让机器能够「看懂世界、说人话」。

来自主题: AI技术研报

10211 点击 2025-11-17 09:53