摘要
本发明涉及视觉检测技术领域,公开了基于多层注意力机制的内窥镜手术器材检测方法,包括以下步骤:步骤S1、采集手术原始数据,并对采集的原始数据进行标注从而形成数据集;步骤S2、构建swin‑yolo检测模型;步骤S3、利用数据集对swin‑yolo检测模型进行训练与优化;步骤S4:选取训练精度最高的swin‑yolo检测模型对内窥镜图像进行检测。本发明增强了特征在不同通道之间的互动,提升了复杂环境下的目标检测精度;提升了特征融合的效率和精度,特别是在处理内窥镜图像中的小目标和尺度变化时,展现了更高的检测能力;使得模型能够有效应对手术器材在图像中的位置变化和大小差异,极大地提高了对小尺寸或远距离目标的检测精度,保证了手术过程中器材定位的精准性和实时性。