改进的SSD网络用于在被动太赫兹安全图像中快速检测和识别隐藏对象

2022-07-18 16:22:40方媛元
导读 随着全球反恐措施的加强,在公共场所进行安全检查以检测人体携带的隐蔽物品变得越来越重要。近年来的研究表明,深度学习有助于检测被动太赫

随着全球反恐措施的加强,在公共场所进行安全检查以检测人体携带的隐蔽物品变得越来越重要。近年来的研究表明,深度学习有助于检测被动太赫兹图像中的隐藏物体。然而,以前的研究未能实现实时标记的卓越准确性和性能。我们的研究旨在提出一种新方法,用于准确、实时地检测太赫兹图像中的隐藏物体。为了达到这个目标,我们使用被动太赫兹设备收集的人体图像数据,训练并测试了一种基于深度残差网络的有前途的检测器。具体来说,我们将SSD(SingleShotMultiBoxDetector)算法的主干网络替换为更具代表性的残差网络,以降低网络训练的难度。针对小目标重复检测和漏检的问题,提出了一种基于特征融合的太赫兹图像目标检测算法。此外,我们在SSD中引入了混合注意力机制,以提高算法获取对象细节和位置信息的能力。最后,引入FocalLoss函数来提高模型的鲁棒性。实验结果表明,SSD算法的准确率从95.04提高到99.92%。与当前其他主流模型,如FasterRCNN、YOLO和RetinaNet相比,该方法可以在更快的速度下保持较高的检测精度。这种基于SSD的方法在验证子集上实现了99.92%的平均精度、0.98的F1分数和17FPS的预测速度。本文提出的基于SSD-ResNet-50的方法可为深度学习技术在太赫兹智能安防系统中的应用和发展提供技术参考。未来可广泛应用于一些有实时安检需求的公共场景。

近年来,全球反恐形势日益严峻。公共场所的安全检查逐渐引起各国的广泛关注。在人流密集的公共场所,除了对人们携带的包裹进行安全检查外,对人体进行安全检查以发现危险的隐藏物品也很重要。但是,现有的安检系统或多或少都存在一些不足。在这种情况下,以电磁波为检测手段的太赫兹安检系统发挥着越来越重要的作用。

太赫兹波是指频率在0.1到10THz之间的电磁波,其特性类似于微波和红外线1。太赫兹成像不仅可以检测金属物体,还可以检测非金属违禁品,例如炸药、陶瓷刀、和玻璃刀2、3。太赫兹波可以穿透绝缘材料,例如衣服、塑料和陶瓷4,5,6,因此它们可用于检测隐藏在人类衣服下的物体。与微波相比,太赫兹波具有更短的波长和更高的成像精度。与X射线和可见光相比,太赫兹波的波长要长得多。因此,基于太赫兹系统的人体安全成像的分辨率和信噪比与X射线成像和可见光成像有很大的不同。这样的特性使得太赫兹成像很难使用现有的物体检测算法自动检测危险物体。太赫兹成像系统分为主动和被动两种工作模式。在检测人体隐蔽物体的应用中,被动太赫兹成像系统占据主要地位7、8.被动太赫兹成像系统不发射电磁波,不会对人体造成伤害。目前被动太赫兹成像的速度高达每秒10帧,这对检测的速度和精度提出了更高的要求。目前,太赫兹系统获取的图像大多是由人工一张一张检查,不仅耗费大量人力,而且长时间标记图像可能导致漏检。因此,被动太赫兹图像自动识别技术的进步对于智能安检场景的广泛采用至关重要。

众所周知,太赫兹成像系统的安检旨在检测和识别人体携带的危险物品的威胁。近年来,越来越多的太赫兹被动成像系统被研究,但从太赫兹图像中识别或定位危险物体的理论和方法仍处于起步阶段。与光学和主动太赫兹成像相比,被动太赫兹图像信噪比低,容易受到背景变化的影响。这些特性使得使用被动太赫兹成像系统进行安检成为一项巨大的挑战。传统的被动太赫兹图像目标检测算法主要包括基于分割的检测算法和基于特征匹配的检测算法。基于分割的检测算法利用被动太赫兹图像中的灰度信息将图像分为目标和背景两个区域,然后检测目标。目前常用的分割算法有最大熵分割法9、Otsu法10、区域生长法等。基于目标分割的算法速度快,易于实现,但不能检测复杂的目标。基于特征匹配的检测算法构造一个目标特征描述符来匹配已知的先验特征信息。常见特征包括Haar特征11、梯度直方图12(HOG)、密集SIFT特征13等。基于特征的检测方法依赖于手动特征提取。然而,由于人工构造的特征通常仅限于特定的对象类型,因此无法获得令人满意的对象检测结果。近年来,随着深度学习的发展,深度卷积神经网络在光学图像目标检测中的应用取得了良好的效果,其检测精度远优于传统方法14、15.低分辨率被动太赫兹图像包含的信息非常少,因此很难手动从图像中提取特征。CNN网络可以自动从被动太赫兹图像中提取特征。大规模CNN网络虽然具有良好的检测和分类效果,但由于参数大、结构复杂,无法满足实时性能。大量研究表明,当前基于CNN的太赫兹图像目标检测算法在精度和速度上仍有提升空间16,17,18.因此,迫切需要提出一种在被动太赫兹图像中具有足够准确度和鲁棒性的物体识别方法。然而,据作者所知,该领域的研究屈指可数。

在被动太赫兹图像物体识别领域直接使用深度学习算法存在两个主要问题,一是物体检测精度不高,二是物体检测速度不够快。针对这两个问题,我们选择了在自然光物体检测算法中精度和速度都比较高的单阶段检测算法SSD作为基础模型。这是SSD算法在被动太赫兹图像目标检测领域的首次应用。我们研究了残差网络ResNet-50在检测被动太赫兹图像中隐藏物体的准确性和实时性能方面的潜力。本文描述的方法旨在选择最有效的CNN架构,并进一步探索其修改和优化的方法,以确保在检测隐藏物体方面具有出色的实时分类潜力。本研究的意义和独创性在于首次探索SSD模型在被动太赫兹图像检测领域的应用,并针对图像特征提出了多项重要改进。本研究的最终目标是开发一种快速准确的被动太赫兹图像检测算法,并推动其在智能安检场景中的实际应用。我们提出以下改进,以进一步提高算法在检测隐藏物体方面的准确性和速度。总结一下,

针对SSD算法中VGGNet网络19的网络退化问题,改进算法采用ResNet-50网络20作为特征提取网络。

针对小物体检测性能差的问题,我们提取多级特征形成特征金字塔网络21,用于检测不同尺度的物体。通过上采样,将深层特征和浅层特征融合起来,构建具有丰富语义信息的特征表示,使融合后的特征更具描述性。

所提出的算法将空间通道注意机制引入SSD网络,以增强高级特征图的语义信息。因此,可以提高算法获取物体细节和位置信息的能力,从而降低漏检率和误检率,提高小物体的检测精度。

本文引入FocalLoss22来改善正负样本和难易样本的不平衡。通过增加损失函数中硬样本的权重,可以提高所提算法的鲁棒性。

与未经优化的SSD算法相比,该方法可以提高检测精度,同时满足智能安检场景下的检测速度要求。具体来说,我们提出的算法的平均精度达到了99.92%,算法的检测速度可以达到17FPS,可以满足实时性要求。这是早期方法无法获得的极好的结果。论文的其余部分组织如下:太赫兹图像对象检测的相关工作和SSD算法的基本介绍在“相关工作”中介绍。在下一节中,将详细介绍所提出的改进SSD算法。“实验结果与讨论”部分展示并分析了我们的方法在部署后的实验结果。论文的结论在最后一节形成。

免责声明:本文由用户上传,如有侵权请联系删除!