音频-视觉全模态的未来预测,FutureOmni给出了首份答卷 音频-视觉全模态的未来预测,FutureOmni给出了首份答卷 关键词: AI,模型训练,FutureOmni,视觉全模态 复旦大学、上海创智学院与新加坡国立大学联合推出首个全模态未来预测评测基准 FutureOmni,要求模型从音频 - 视觉线索中预测未来事件,实现跨模态因果和时间推理。 来自主题: AI技术研报 5115 点击 2026-01-26 10:19