AI资讯新闻榜单内容搜索-Temporal

从贝叶斯到大语言模型：一文详解「时序点过程」近年进展

机器学习已经习惯了处理序列：一句话中的词、视频中的帧、推荐系统中的点击、金融市场中的订单。但在很多真实场景里，数据并不是按固定步长排好队出现的。

来自主题: AI技术研报

8124 点击 2026-06-17 09:53

多轮Agent蒸馏终于不翻车！港中文x通义新方法成功率暴涨18点，训练还快32%

把强大模型的能力“蒸馏”给小模型，听起来很美—— 但放到多轮对话Agent场景里，效果往往一塌糊涂。

来自主题: AI技术研报

8651 点击 2026-05-07 10:17

具身大模型LaST₀：双臂/移动/灵巧手全面新SOTA，首次引入隐空间时空思维链

LaST₀团队投稿量子位 | 公众号 QbitAI 近日，至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型，在基于Transformer混

来自主题: AI技术研报

7059 点击 2026-02-08 11:50

陈天桥旗下盛大AI东京研究院于SIGGRAPH Asia正式亮相，揭晓数字人和世界模型成果

在 SIGGRAPH Asia 2025 期间，盛大 AI 东京研究院（Shanda AI Research Tokyo）以展台活动、BoF 学术讨论与顶尖教授闭门交流等形式完成首次公开亮相，标志着盛大在数字人的 “交互智能 (Interactive Intelligence)” 与世界模型的 “时空智能 (Spatiotemporal Intelligence)” 等两大方向的研究

来自主题: AI资讯

9570 点击 2025-12-22 12:50

NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型，推动自动驾驶迈向视觉推理

面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介，易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive（FutureSightDrive）提出 “时空视觉 CoT”（Spatio-Temporal Chain-of-Thought），让模型直接 “以图思考”，用统一的未来图像帧作为中间推理步骤，联合未来场景与感知结果进行可视化推理。

来自主题: AI技术研报

8879 点击 2025-10-06 13:42

Temporal：Nvidia、OpenAI 都在用，为什么 Agent 还需要专门的长程任务工具？

虽然大家都期待未来的 Agent 能够真正端到端完成所有任务，并且在出错时也知道如何重新开始，但目前 AI 还没有达到这种能力。

来自主题: AI资讯

8476 点击 2025-09-05 11:57

AI让客服效率提升300%，这家公司6天完成种子轮到1年拿下B轮背后的秘密

当大多数人还在抱怨传统工单系统的笨重时，一家叫做 Pylon 的公司却在短短18个月内完成了从种子轮到B轮总计5100万美元的融资，估值飙升至8亿美元。更令人震惊的是，他们已经吸引了780多家快速增长的公司，包括 Together AI、Cognition 和 Temporal，其中超过150家公司主动从 Zendesk、Intercom 等老牌平台迁移过来。

来自主题: AI资讯

9483 点击 2025-08-31 13:12

生成越长越跑偏？浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

本文介绍了一篇由浙江大学章国锋教授和商汤科技研究团队联合撰写的论文《StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation》。

来自主题: AI技术研报

9706 点击 2025-01-17 11:14

聚焦「视听触感官」协同配合的具身精细操纵，人大胡迪团队领衔探索机器人模态时变性挑战

中国人民大学高瓴人工智能学院 GeWu 实验室、朝闻道机器人和 TeleAI 最近的合作研究揭示并指出了 “模态时变性”（Modality Temporality）现象，通过捕捉并刻画各个模态质量随物体操纵过程的变化，提升不同信息在具身多模态交互的感知质量，可显著改善精细物体操纵的表现。论文已被 CoRL2024 接收并选为 Oral Presentation。

来自主题: AI技术研报

5763 点击 2024-11-08 19:26

单帧标注视频就能学到片段特征，达到全监督性能！华科拿下时序行为检测新SOTA｜AAAI24

如何从一段视频中找出感兴趣的片段？时序行为检测（Temporal Action Localization，TAL）是一种常用方法。过去TAL中的建模是片段甚至实例级的，而现在只要视频里的一帧就能实现，效果媲美全监督。

来自主题: AI技术研报

8849 点击 2024-01-08 14:33