摘要
本发明涉及人工智能技术领域,可应用于机械臂智能抓取、金融科技及医疗健康等业务场景中,公开了一种目标物品智能抓取控制方法、装置、设备及介质,包括:获取目标物品图像、物品描述文本和机械臂关节状态;通过视觉编码器提取视觉特征向量;通过语言编码器生成语义向量;将视觉特征向量与语义向量输入语言模型进行特征融合,生成多模态理解信息;基于多模态理解信息和机械臂关节状态,通过动作解码器生成机械臂关节位移指令;控制机械臂执行机械臂关节位移指令以抓取目标物品。本发明通过融合多源信息,提升了机械臂对目标物品的理解能力,结合机械臂状态信息,实现了复杂环境下的精准抓取与高效控制,增强了系统的稳定性与适应性。