AI“定制框”助力无人机高效巡检
2026-06-03
22

日常生活中,我们偶尔会看到高空电线上挂着断线的风筝、气球或是农用塑料薄膜。在电力保障部门眼中,这些物体是不折不扣的“隐形炸弹”。它们极易挂触高压线路,引发电路短路、跳闸停电,甚至会对树线下的行人和车辆造成安全威胁 。
为了保障高压输电线的安全,电力行业需要定期进行异物巡检。传统的巡检主要依靠人工拿望远镜看,或者派出无人机拍摄照片和视频。人工巡检不仅效率有限,在面对崇山峻岭、跨江大桥等复杂地形时还存在一定的安全风险;无人机虽然能轻松拍下大量高清画面,但后续依然需要耗费大量的人力坐在电脑前用肉眼核对,工作量十分巨大。
过去,工程师曾尝试利用传统的计算机数字图像处理技术(如高斯滤波、阈值分割等)来自动识别异物。由于中国各地的地理背景差异巨大(有时是高山,有时是城市建筑),加之天气的阴晴、光照各不相同,传统的算法很难找到一个通用的数学标准来区分背景与异物。
针对这一应用痛点,这篇研究基于深度学习技术,为高压线异物检测量身定制了一套名为RCNN4SPTL的智能识别网络,实现了检测速度与准确率的平稳提升。
原版的Faster R-CNN是深度学习领域非常经典的目标检测算法,最初用来识别日常生活中形态相对固定的行人、车辆或水果。面对高空输电线上那些飘忽不定、没有固定形状的塑料膜或挂烂的风筝,原版大模型不仅训练难度高,计算起来也比较机械。为了让AI在不牺牲性能的前提下算得更快,研究团队对网络的特征提取核心进行了精简与改造,开发出了专用的SPTL-Net。

如图2所示,SPTL-Net包含8层结构,前5层为卷积层(conv1~conv5),后3层为全连接层(fc1~fc3)。团队在这里使用了一种更小的卷积核(如 5×5 和 3×3),以此来更细腻地捕捉图像中纤细的输电线以及附着其上的微小异物边缘,适当精简了神经元数量,从而在底层提高了算法的运行速度 。
AI在图像上寻找目标时,需要依赖一种叫“候选框(Region Proposals)”的虚拟探测抓取框。 传统Faster R-CNN默认的抓取框长宽比是标准的1:1、1:2和2:1。但在流媒体或无人机返回的真实电力场景中,挂在电线上的塑料薄膜或长条气球在画面中往往呈现出又细又长的形态。作者团队敏锐地捕捉到了这一几何特质,他们直接修改了AI生成候选框的底层参数,将长宽比重塑为 1:1、2:1和3:1。这一个微小的调整让AI扫描画面时,能够以更高的概率和更贴合的形状精准包裹住那些狭长的异物,显著降低漏检率。同时,团队摒弃了传统的“交替式伪特征共享训练” ,采用了端到端的联合训练方法 。将区域生成网络(RPN)与分类回归网络视为一个有机整体同步训练,让AI的不同模块在同一条流线上互相修正。
为了测试这套定制网络的实际威力,研究团队利用真实的现场场景搭建了一套包含5000张手工标注图像的训练集,其中包含2000张薄膜、1000个气球和2000个风筝。经过20000次的联合训练迭代后,模型测试效果为:

霍夫变换(传统图像处理):准确率仅为0.3642,每处理一帧画面需要耗时5.52秒,无法做到实时分析。原生Faster R-CNN(通用深度学习):准确率为0.7089,每帧耗时0.30秒。本研究的RCNN4SPTL模型:准确率平稳提升至0.8601,处理单帧画面的时间缩短到了0.23 秒!每秒钟可以自动读懂4帧以上的巡检视频画面,在工业部署中表现出了良好的应用前景。
作者简介:张卫山,中国石油大学(华东)计算机科学与技术学院教授、博士生导师,人工智能系系主任。长期从事联邦学习、区块链、可信人工智能与大数据智能处理研究。
ORCID:0000-0001-9800-1068
DOI:10.1016/j.procs.2019.01.232