以下为《相关运动目标检测技术》的无排版文字预览,完整内容请下载
相关运动目标检测技术
运动目标检测是计算机视觉与模式识别领域中经典任务之一。其任务主要是实时、精确地从视频中分割出感兴趣区域。传统的运动目标检测算法主要包括帧差法、光流法与背景建模法三大类。同时,随着深度学习的快速发展,基于卷积神经网络的深度学习算法也越来越多地被应用于运动目标检测任务中。图2-3展示了各类运功目标检测方法。
图2-3 运动目标检测算法总结
1)帧差法
1979年,Jain等人[6]首次提出使用帧间差分的方法对背景固定的视频进行运动目标的检测。帧差法主要利用摄像机采集视频序列的连续性的特点,通过在图像序列的相邻两帧或多帧之间采用基于像素的时间差分的方法,来提取出图像中的运动区域。对于像素值变化小于阈值的判定为背景像素,反之将其判定为前景像素,由此得到运动目标前景检测结果。普通的两帧帧差法是利用第t-1帧的图像与第t帧的图像做差分运算,算法流程图如图2-4所示。帧差法的优点在于其计算的复杂度低,具有较好的实时性。当然,这类算法存在目标检测的轮廓不理想、前景目标的连通性容易被破坏等问题。
图2-4 两帧差分法算法流程图
2)光流法
光流法是一种图像像素运动的表示方法[1],它是利用像素的运动矢量特征来对图像进行动态分析建模,通过建立光流场来对比各像素光流矢量的特征,从而进行运动检测。1998年Negahdaripour将光流重新定义为对动态图向的集合变化与辐射度变化的全面表示[2]。在光流场中,当图像中没有运动目标存在时,每个像素点的光流矢量是连续变化的;而当图像中存在运动目标时,前景与背景的光流矢量便会表现出差异,由此检测出运动目标区域。
一般情况下,引起光流变化的因素包括相机运动、场景中目标的运动或者两者的共同运动产生的相对运动。对于光流的计算方法,大致上可以分为以下四类:基于匹配的方法、基于频域的方法、基于梯度的方法与基于相位的方法。
① 基于匹配的方法实际上是在图像序列中的图像之间,搜索到相邻两帧图像的区域的最佳拟合的位移,其得到的位移即为运动目标的运动矢量。基于匹配的方法所存在的主要问题是其得到的光流通常为稀疏光流,要想实现精准的匹配效果比较困难。
② 基于频域的方法是通过使得调谐滤波器的输出能量达到最大值来计算光流。要想使用该类方法,首先要获得对于均匀流场的准确的速度估计,即对时间与空间进行整合。基于频域的方法往往设计大量的计算,同时,对其进行可靠性分析也十分困难。
③ 基于梯度的方法也被称为微分法,它利用序列图像的时空梯度函数,通过使得全局的能量达到最小值,来计算像素的速度矢量。这类方法的代表性算法有Horn-Schunck全局平滑法[3]与Lucas-Kanade局部平滑法[4]。HS光流法为了使得泛函能量函数达到最小化,在光流方程的基础上添加了全局平滑假设。LS光流法则是使用局部的平滑假设,即假设某一窗口中的所有像素均有相同的运动矢量。但是这种方法在有较大的运动矢量存在时会产生较大的误差。
④ 基于相位的方法是Fleet和Jepson在1990年首次提出的[5]。在计算光流的过程中,相较于图像亮度信息,图像的相位信息往往更加可靠,鲁棒性也更强。当然,基于相位的方法也存在诸如时间复杂性较高,对图像序列的时间混叠比较敏感等问题。
3)背景建模法
背景建模法是传统运动目标检测方法中应用最为广泛的方法。背景建模法的基本思想是针对视频序列建立合适的背景模型,通过背景模型来判定各像素的灰度和纹理等信息的变化,最终实现视频帧中前景与背景的分割。背景建模法的三个基本步骤为建立背景模型、检测前景信息以及更新背景模型。
较为经典的 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 FlowNet: Learning Optical Flow with Convolutional Networks. 2758-2766. 10.1109/ICCV.2015.316.
[18] Sun D , Yang X , Liu M Y , et al. PWC-Net: CNNs for Optical Flow Using Pyramid, Warping, and Cost Volume[C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2018.
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《相关运动目标检测技术》的无排版文字预览,完整内容请下载
相关运动目标检测技术由用户“miker115”分享发布,转载请注明出处