文章来源:SD科技制造 计算机视觉life”,选择“星标” 快速获得最新干货 本文转载自动驾驶之心 摘要简介 随着机器人技术和人工智能(AI)技术的发展,自动驾驶车辆(汽车)已成为工业界和学术界的一个热门话题(Badue等人,2021)。为了安全导航,它需要为周围环境创建一个准确的表示,并估计其中的自车状态(即自车定位)。传统的定位方法基于GPS或实时动态(RTK)定位系统(Cadena等人,2016b)。然而,由于信号反射、时间误差和大气条件,GPS的测量误差限制在十几米以内,这对于车辆导航来说是不可接受的,尤其是当车辆在隧道和城市峡谷场景中行驶时(Cheng等人,2019)。RTK能够通过固定校准基站的内部校正信号来校正这些误差,但这种系统依赖于成本较高的附加基础设施(Infotip Service GmbH,2019)。SLAM方法被认为是自动驾驶车辆定位和导航的良好解决方案,它可以实时估计移动车辆的姿态,同时构建周围环境的地图(Durrantwhyte和Bailey,2006)。根据传感器类型的不同,SLAM方法主要分为两类:LIDAR SLAM和视觉SLAM。由于激光雷达SLAM比视觉SLAM启动得早,因此在自动驾驶仪的应用中相对成熟(Debeunne和Vivet,2020a)。与相机相比,激光雷达传感器对光照和夜间的变化不太敏感。此外,它还可以提供具有更大视野(FOV)的3D地图信息。然而难以负担的成本和大规模的长开发周期导致激光雷达传感器难以普及。相比之下,视觉SLAM具有信息丰富、易于安装的优点,并且使系统更便宜、更轻。目前视觉SLAM系统可以在微型个人计算机(PC)和嵌入式设备中运行,甚至可以在智能手机等移动设备中运行(Klein和Murray,2009)。 与室内或室外移动机器人不同,自动驾驶车辆具有更复杂的参数,尤其是当车辆在城市环境中自动驾驶时。例如,环境的面积更大,有动态障碍,因此视觉SLAM方法的性能不够准确和鲁棒(Cadena等人,2016a)。诸如误差累积和照明变化以及快速运动等问题导致有问题的估计。已经考虑了各种方法来解决与自动驾驶车辆相关的这些问题。例如用于视觉里程(VO)的基于特征点/直接/半直接/点线融合的算法(Singandhupe和La,2019),以及用于姿态估计的扩展卡尔曼滤波器(EKF)/基于图的优化算法(Takleh等人,2018)。同时,基于视觉的多传感器融合方法也为提高自主系统的精度而引起了极大的关注。 在基于视觉的SLAM系统中,除了建图模块之外,传感器数据的收集(如相机或惯性测量单元(IMU)、VO和视觉惯性里程计(VIO)系统)在前端完成,而优化、闭环在后端完成。重定位始终被认为是提高视觉SLAM系统准确性的附加模块(Taketomi等人,2017)。本文综述了视觉SLAM方法。这主要是从视觉SLAM系统的定位精度方面考虑的,并且已经尽可能详细地研究了可能应用于自动驾驶场景的方法,包括纯视觉SLAM方法、视觉-惯性SLAM方法和视觉-LIDAR-惯性SLAM方法,并且将论文先前工作的定位精度与公共数据集上的已知方法进行了比较。这篇综述对视觉SLAM技术进行了详细的综述,可以为自动驾驶汽车领域的新研究人员提供友好的指南。此外,它可以被视为一本词典,供有经验的研究人员在未来的工作中寻找可能的方向。 视觉SLAM原理 视觉SLAM系统的经典结构可分为五个部分:相机传感器模块、前端模块、后端模块、回环模块和建图模块。如图1所示,相机传感器模块负责收集图像数据,前端模块负责跟踪两个相邻帧之间的图像特征,以实现初始相机运动估计和局部建图,后端模块负责前端的数值优化和进一步的运动估计,回环模块负责通过计算大规模环境中的图像相似度来消除累积误差,建图模块负责重建周围环境(Gao等人,2017)。 文章来源:SD科技制造 转载声明: 本文为转载发布,仅代表原作者或原平台观点或立场,不代表我方观点。亚太菁英传媒及旗下澳洲门户网(ozportal.tv)仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络info@ozportal.tv。 |