摘要
本公开关于一种视频描述信息的生成方法、装置、设备及存储介质,该方法包括:确定待分析对象在待分析视频中的运动变化信息;运动变化信息用于指示待分析视频中的对象动作变化的物理属性;将待分析视频和包括运动变化信息的第一提示信息输入至大语言模型,获得大语言模型输出的运动事件表示;第一提示信息用于引导大语言模型对待分析视频进行至少一个语义层次的运动解析,以生成结构化的运动表示;将待分析视频和包括运动事件表示的第二提示信息输入至视频描述模型,获得视频描述信息;第二提示信息用于引导视频描述模型针对待分析视频生成肢体级别的运动描述。本公开提升了视频描述信息的生成效率和准确度。