考虑到3D配准存在的自由度高、非线性优化难度大的问题,人们考虑利用一些人为的干预来解决。2D配准的方案,就是将点云数据往xy平面投影,从而生成一张从上到下的俯视图来进行匹配运算。在下面的示意图中,(a)可以认为是高精度地图中存储的投影结果,而(b)是实时采集的点云数据的投影结果。 (a)
(b)
经过这种处理,高精地图中存储的投影结果和实时采集的点云数据的投影结果仅存在旋转角、x方向平移量和y方向平移三个自由度。
2D配准还有一个明显的好处就是在这种投影变换下,xy平面可以约等于路面。而路面中存在的车道线、地面标记、护栏等大量具有鉴别意义的区域,可以有效的提高自定位的精度和稳定性。对于上述投影结果的匹配,通常的配准算法都可以胜任,包括基于频域的配准算法(模板匹配、Lucas-Kanade配准)、基于频域的配准算法(傅立叶-梅林算法)以及基于特征域的配准算法(SIFT、SURF、MSER)。 激光点云+2D配准方案也存在一些缺点: 2D配准主要依赖路面信息,忽视了交通标牌、红绿灯等3D信息,降低了方案的普适性。 当遇到缺乏纹理或者纹理大量重复的路面环境时(例如高速、匝道等),很容易配准失败且不自知。 图像数据+视觉地图 图像数据对比激光点云数据主要的优点是成本更低,因此很早之前就有很多计算机视觉领域的方案致力于解决自定位的问题。其中一种典型的方案就是视觉地图的方案。它主要使用了特征点的定位和描述、以及立体几何方面的知识,包括粗定位和细定位两步。 粗定位指的是米量级以内的定位。如下图所示,该步骤类似于计算机视觉中的场景分类技术。在高精度地图的制作过程中,每行驶1m就采集一张图像,并利用SIFT、HOG等特征描述子提取图像特征。在实时定位时,也对当前采集的图像提取图像特征并和高精度地图局部范围内的存储结果进行匹配。最终将图像特征最为接近的那一张作为参考图像,完成米量级的定位。
而细定位则需要定位到厘米量级。通过对参考图像和实时采集的图像进行多视角几何分析,确定两张图像对应的相机间的3D旋转和3D平移变换来完成自定位。这个很类似于激光点云+3D配准方案,但与其不同的是,利用图像层面的特征点提取、分析和匹配,我们已经可以确定匹配的点对了。 图像数据+视觉地图面临的问题包括: 参考图像的确定主要依赖图像整体特征的提取和匹配,对于缺乏纹理或者纹理大量重复的区域(例如高速),自定位精度大大降低。 与激光点云数据不同,高精度地图存储结果和实时采集的图像受到日期、天气、路况等多种因素的影响会产生明显差异,可能导致匹配失败。 精确自定位算法取决于图像特征点的提取和匹配,但一般很难达到10cm左右定位精度的要求。 图像数据+关键目标的检测和匹配 如果说上述方案都是基于点层面的下层(low-level)信息,那么关键目标的检测和匹配的方案则利用了物体级别的上层(high-level)信息。通过提取一些关键目标和对应的精确的几何特征,atv,并将其和高精度地图中存储的信息进行对应和匹配,从而完成自定位。该方案更加接近于人类的直观思维。 这里的关键目标包括车道线、地面标记、交通标牌以及红绿灯等。在该方案中,将自定位划分成x方向和y方向分别进行处理。 x方向指的是垂直于路面前进的方向,通常利用车道线、路沿、护栏来确定。通过深度学习的技术,可以很稳定的在光照变化、场景突变等情况下完成上述目标的检测和几何拓扑的分析。只要和高精度地图中相应目标的存储数据进行对应,即可完成x方向的定位,如下图所示。
(责任编辑:本港台直播) |