Ultra-Fast-Lane-Detection代码解析-Toy模板网

这篇具有很好参考价值的文章主要介绍了Ultra-Fast-Lane-Detection代码解析。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

近期由于学习要求，复现成功Ultra-Fast-Lane-Detection代码后，记录下自己在原理上的学习笔记，本人刚接触这块，有不对的地方欢迎指正。

代码链接：GitHub - cfzd/Ultra-Fast-Lane-Detection: Ultra Fast Structure-aware Deep Lane Detection (ECCV 2020)

论文创新点：

使用全局特征的基于行的选择问题，提出了一个结构损失模型来明确地建模车道的结构。

对于车道检测，主流的方法有两种，一种是传统图像处理方法，另一种是深度分割方法。

利用全局特征在图像的预定义行中选择车道的位置，而不是基于局部接受域分割车道的每个像素，这大大降低了计算成本。

利用全局特征，获得了整幅图像的接受域。

车道不是用分割地图来表示，而是用不同行上的选定位置来表示。

通过优化所选位置的关系，即结构损失，直接利用车道的刚性、光滑性等特性。

基于全局特征预测每个行锚上所有位置的概率分布。因此，可以根据概率分布来选择正确的位置（即根据车道线分布的全局信息，预测对于某一行锚中车道线的分布）。

Ultra-Fast-Lane-Detection代码解析,python,计算机视觉,深度学习,人工智能,Powered by 金山文档

下图就是论文中将论文结果的预测方式与分割网络的预测方式进行对比。

针对算法研究中输入/输出数据的解读

输入数据的处理在data文件夹中。

复现采用CULane数据集，读取原始图片格式为（288，800）/（h，w）

选择dataset后做图片预处理，在data/dataset.py中可以看到预处理代码。

    def preprocess(self, image, swap=(2, 0, 1)):
        resized_img = cv2.resize(image,(800,288)).astype(np.float32)
        resized_img=resized_img[:,:,::-1]
        resized_img /= 255.0
        resized_img -= (0.5, 0.5, 0.5)
        resized_img /= (0.5, 0.5, 0.5)
        resized_img = resized_img.transpose(swap)
        padded_img = np.ascontiguousarray(resized_img, dtype=np.float32)

data/dataloader.py读取数据集定义trian和test数据集，CULane数据为18个点，图片格式为（288，800）/（h，w）

transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224,0.225))。

netron查看输入数据格式为