目标物品智能抓取控制方法、装置、设备及介质

申请号：CN202511051737

申请日期：2025-07-29

公开号：CN120921370A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于机械臂智能抓取、金融科技及医疗健康等业务场景中，公开了一种目标物品智能抓取控制方法、装置、设备及介质，包括：获取目标物品图像、物品描述文本和机械臂关节状态；通过视觉编码器提取视觉特征向量；通过语言编码器生成语义向量；将视觉特征向量与语义向量输入语言模型进行特征融合，生成多模态理解信息；基于多模态理解信息和机械臂关节状态，通过动作解码器生成机械臂关节位移指令；控制机械臂执行机械臂关节位移指令以抓取目标物品。本发明通过融合多源信息，提升了机械臂对目标物品的理解能力，结合机械臂状态信息，实现了复杂环境下的精准抓取与高效控制，增强了系统的稳定性与适应性。

技术关键词

机械臂关节智能抓取语言编码器语义向量多模态抓取动作文本语义特征解码器融合多源信息图像指令视觉特征提取注意力计算机设备驱动信号

系统为您推荐了相关专利信息

古建筑数字化交互积木系统及方法

积木单元 UHFRFID读写器积木系统读取RFID芯片拼接角度

一种基于跨模态交互感知的多模态图像融合方法及系统

图像融合方法编码器模块跨模态通道校正融合特征

基于指令流分析的SOC验证优化方法、装置、计算机设备、及介质

序列验证优化方法切片程序指令流

一种基于动态权重网络的多模态问诊评估方法

姿态特征电子病历数据多模态数据采集动态语音

一种基于多模态交互的人工智能科普展示系统及方法

科普展示系统多模态交互密钥硬件安全单元分片