机器人操作轨迹的人类偏好标注方法及相应的机器人学习系统
申请号:CN202510039163
申请日期:2025-01-10
公开号:CN120011835A
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供了机器人操作轨迹的人类偏好标注方法及相应的机器人学习系统,包括基于属性和原则的数据库聚类方法、后端主动查询模型和前端混合主动用户界面;机器人轨迹数据集通过三个主要原则进行聚类:安全性、效率和性能;对于每个原则,收集可量化的属性,在每个时间步骤中将其连接成一个主向量,并形成整个轨迹的主向量时间序列。然后,利用DTW根据每个主向量序列对轨迹数据集进行聚类;在根据每个原则收集偏好时,后端模型会计算我们在偏好引出过程中根据用户需求设计的几个指标的加权平均值,例如比较轨迹对的难度、人类评估者之间的分歧以及标记和未标记轨迹对的偏斜度;前端呈现轨迹视频对,供人类评估者比较和指定他们的偏好。
技术关键词
机器人学习系统
标注方法
轨迹
人类
特征值
配对方法
数据
收集机器人
人工智能模型
生成机器人
查询模型
聚类方法
机械人
指标
模块
关键帧
视频帧