面向家居服务场景的移动机器人智能跟随与操作方法研究文献综述

 2023-09-04 10:09

文献综述(或调研报告):

面向家居服务场景的移动机器人是机器人家族中的重要成员。其主要特点是需要和人类进行交互、完成特定的服务任务、在复杂环境下工作。涉及到的关键技术分别是目标跟踪、目标检测、自主导航。

3.1 目标跟踪

目标跟踪通常分为生成模型方法和判别模型方法两大类。生成模型方法的思路是在当前帧对目标区域建模,然后在下一帧寻找与所建模型最相似的区域,即得到预测位置,比较著名的有卡尔曼滤波,粒子滤波等。判别模型方法的思路是在当前帧以目标区域为正样本,背景区域为负样本,通过机器学习方法训练分类器,下一帧用训练好的分类器找最优区域。

基于颜色的目标跟踪算法meanshift和camshift,二者都利用到了颜色直方图模型,将原图变换到HSV空间,并且提取H分量获得它的直方图,然后反投影到原图从而将图像转换为颜色概率分布图,利用概率密度的梯度爬升来寻找局部最优。基于特征点的跟踪方法,通过提取目标区域的特征点如Harris角点、SIFT等,在帧间进行特征点匹配或光流计算进而实现跟踪。在深度学习和相关滤波的跟踪方法出现后,经典的跟踪方法基本都被舍弃。Struck[1]用到了haar特征和结构化的SVM输出,Z.Kalal提出一种稳定的长时间跟踪算法TLD[2],通过一种称作P-N学习的方法来在线更新模型和有关的参数,最后能够获得更加稳定的跟踪效果。相关滤波类的算法有CSK[3],MOSSE[4],KCF[5]等。其中KCF算法基于相关滤波,用岭回归训练样本,循环矩阵采样,傅里叶空间加速计算,核空间映射等技巧,具有不错的跟踪效果以及实时性。

3.2 目标检测

目标检测是计算机视觉领域的重要任务之一。目标检测的任务是在图片中找到目标所在位置并标出类别,目标检测算法通常被分成三类:传统的目标检测算法、使用候选区域结合深度学习分类器的检测算法、使用深度学习的回归算法。

传统的目标检测通常采用手工设计特征的方法,结合分类器完成特定目标的检测。方向梯度直方图(HoG)通过计算和统计梯度来获得特征,结合SVM在行人检测问题上获得成功[6]。此外,还有Harr特征用于人脸检测,OpenCV中已经集成了一些相关的XML数据文件和人脸检测函数。

第二类算法的思路是提取候选区域,然后运用技术已经相当成熟的深度学习分类模型,完成目标的检测。R-CNN[7]首先使用选择算法挑选出2000个候选区域,通过卷积神经网络得到每个区域的特征向量,最后对每一个特征向量使用SVM分类器得到结果。这种方法步骤多,速度慢,空间开销大。Fast R-CNN是对R-CNN的改进,首先处理整张图片得到卷积特征,再映射到候选区域上避免了冗余的计算;用Softmax层替代了SVM分类器,在速度和精度上都有较大提升。Faster R-CNN[8]用神经网络来生成候选区域,进一步加快了速度。

使用深度学习的回归算法。这类模型将图像的像素值作为输入,将目标类别、目标位置坐标作为输出,形成一个回归问题,运用多层的神经网络训练获得参数。这种端到端的方法使得推理的速度非常快。其中,神经网络的低层级可以学习简单的几何特征,越深的层级可以组合出越来越复杂的语义信息,从而最后能完成目标检测的任务。YOLO[9]是这种算法的代表。此后YOLOv2[10]使用了批归一化等深度学习方法加快速度,增加passthrough层实现了细粒度特征识别,大大提升了YOLO的性能。YOLOv3[11]借鉴残差网络结构加深网络,进一步使用了多尺度特征检测,提高了mAP和小物体检测的效果。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。