用pointnet++分类自己的点云数据

这篇具有很好参考价值的文章主要介绍了用pointnet++分类自己的点云数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、简单介绍pointnet++

1.1 三维数据的表示方法

1.2 pointnet算法

1.3 pointnet++算法的提出

 二、pointnet++如何运行自己的数据集?

2.1 确定数据集的基本情况

2.2  以点云分割为例

2.2.1 数据标注

 2.2.2 选择模型

2.2.3 数据预处理

2.2.4  选择模型进行修改

 2.2.5 训练模型部分的修改

 三、如何将模型预测得到的数据打印出来?

3.1 测试模型代码修改

这篇博客主要是针对于现有的热门的激光点云处理算法pointnet++如何分类自己的数据集展开的。在介绍基本的pointnet++算法的概念、基本步骤及思想、部分代码讲解之后,会介绍如何使用自己的数据集进行分类(涉及到详细的代码改进方法及步骤)。

一、简单介绍pointnet++

详细的pointnet代码可以参考这篇博客:PointNet++详解与代码_自动驾驶小学生的博客-CSDN博客_pointnet++

及知乎:PointNet++ 论文及代码解读 - 知乎

1.1 三维数据的表示方法

三维数据的表述形式一般分为四种:

① 点云:由N NN个D DD维的点组成,当这个D = 3 D=3D=3的时候一般代表着( x , y , z ) (x,y,z)(x,y,z)的坐标,当然也可以包括一些法向量、强度等别的特征。这是今天主要讲述的数据类型。

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析


② Mesh:由三角面片和正方形面片组成。

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析


③ 体素:由三维栅格将物体用0和1表征。

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析


④ 多角度的RGB图像或者RGB-D图像

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

而又由于点云更接近于设备的原始表征(即雷达扫描物体直接产生点云)同时它的表达方式更加简单,一个物体仅用一个N × D N \times DN×D的矩阵表示,所以点云成为了众多三维数据表示方法中最重要的一种。在测绘、建筑、电力、工业甚至如今最热门的自动驾驶等领域均有广泛的应用。

1.2 pointnet算法

pointnet的提出主要是基于点云数据的旋转不变性以及置换不变性。详细可参考:【3D计算机视觉】从PointNet到PointNet++理论及pytorch代码_小执着~的博客-CSDN博客_pointnet

其基本的网络结构如下:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

具体来说,对于每一个N × 3 的点云输入,网络先通过一个T-Net将其在空间上对齐(旋转到正面),再通过MLP将其映射到64维的空间上,再进行对齐,最后映射到1024维的空间上。这时对于每一个点,都有一个1024维的向量表征,而这样的向量表征对于一个3维的点云明显是冗余的,因此这个时候引入最大池化操作,将1024维所有通道上都只保留最大的那一个,这样得到的1 × 1024 的向量就是N个点云的全局特征。

如果做的是分类的问题,直接将这个全局特征再进过MLP去输出每一类的概率即可;但如果是分割问题,由于需要输出的是逐点的类别,因此其将全局特征拼接在了点云64维的逐点特征上,最后通过MLP,输出逐点的分类概率。

1.3 pointnet++算法的提出

由PointNet网络结构可以看出,网络只是把全部点拼接在一起,提取一个全局特征,很少考虑一个点的领域结构,而领域是一个十分重要的概念。
PointNet不捕获由度量空间点引起的局部结构,限制了它识别细粒度图案和泛化到复杂场景的能力,简单理解就是功能不强,实际应用效果一般。

所以提出了pointnet++算法,相比于传统的pointnet算法有如下的优点:

1.一种分层的神经网络,在输入点集的嵌套分区上迭代使用PointNet。
2.利用度量空间的距离,能够利用上下文尺度的增长学习局部特征
3.由于不同位置采集的点云数据的密度不一样,能够自适应地结合多尺度特征

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

详细内容及代码讲解可以参考博客:PointNet++论文理解和代码分析 - gzr2018 - 博客园

 二、pointnet++如何运行自己的数据集?

我们都知道典型的常见的点云任务分为分割、分类、补全等,而从官网或者github上下载的数据代码中的数据集均是经典的官方数据集。如:分类多数是采用的modelnet40(即包含了车、飞机、椅子、包等的40分类的数据);分割多是采用的shapenet10。更多的点云数据集可以参考如下博客:点云数据集 资源汇总2_cugyjl的博客-CSDN博客_道路点云数据集

而我们想要利用标准的pointnet++代码跑通自己的数据集又该如何操作呢?接下来进行详细的讲解。

2.1 确定数据集的基本情况

我们自己的数据集首先应该是点云类型的,我们通常可以在拿到数据集后利用点云可视化软件如:CloudCompare进行可视化转换,以确定其是否是我们需要的点云数据。如下图是利用CloudCompare软件打开的吉他和飞机点云输数据。

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 接着需要确定数据的格式:常见的点云数据均是由向量表示的。这些向量通常以X,Y,Z三维坐标的形式表示,而且一般主要用来代表一个物体的外表面形状。不经如此,除(X,Y,Z)代表的几何位置信息之外,点云数据还可以表示一个点的RGB颜色,灰度值,深度,分割结果等。在改进算法之前一定要先确定数据的格式,如标准的modelnet40中采用的就是包含了点云的方向信息的6维数据:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

2.2  以点云分割为例

如果我们以点云分割为例,如何进行自己的点云数据的分割呢?

2.2.1 数据标注

这一步骤即我们熟知的“打标签”,我们都知道二维的数据打标签的方法:即利用boundbox进行目标位置的框选,并把标注的位置标注能够区别于未标注位置的符号或者数字。如下即为常见行人检测跟踪任务中的标注方式:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

而一般进行三维数据的标注一般采用CloudCompare软件进行,详细的操作步骤可以参考我的另一篇博客:如何利用CloudCompare软件进行点云数据标注_拉姆哥的小屋的博客-CSDN博客

在完成数据标注之后我们就能拿到带有标签的点云数据集。下面数据的最后一列即表示人为标注后的标签1。

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 2.2.2 选择模型

在点云的分割模型中可以按照点云是否分布均匀设置不同的算法,针对采样方法:大体分为单一尺度采样和多尺度采样两种。

单一尺度采样(ssg):是指传统的未经过多尺度采样而仅仅依靠初始设定的采样比例进行采样的方法。

多尺度采样:又分为多尺度分组(MSG)如图(a)与多分辨率分组(MRG)如图(b)两类。

1)方案一:多尺度分组(MSG)

对于同一个中心点,如果使用3个不同尺度的话,就分别找围绕每个中心点画3个区域,每个区域的半径及里面的点的个数不同。对于同一个中心点来说,不同尺度的区域送入不同的PointNet进行特征提取,之后concat,作为这个中心点的特征。这个和图像里的spp(spatial pyrami pooling)思想类似,可以提取到不同尺度的局部特征,如图(a)即表示多尺度分组。

2)方案二:多分辨率分组(MRG)

MSG很明显会影响降低运算速度,所以提出了MRG,这种方法应该是对不同level的grouping做了一个concat,但是由于尺度不同,对于low level的先放入一个pointnet进行处理再和high level的进行concat。感觉和ResNet中的跳连接有点类似,如图(b)即表示多分辨率分组。

左边特征向量是通过一个set abstraction后得到的,右边特征向量是直接对当前patch中所有点进行pointnet卷积得到。并且,当点云密度不均时,可以通过判断当前patch的密度对左右两个特征向量给予不同权重。例如,当patch中密度很小,左边向量得到的信息就没有对所有patch中点提取的特征可信度更高,于是将右特征向量的权重提高。以此达到减少计算量的同时解决密度问题。

多尺度(MSG,MRG)和单一尺度相比(SSG)对分类的准确率没有什么提升. 如果点云很稀疏的话,使用MSG或者MRG就会获得更好的效果。

通常在官方给出的代码中会同时出现这几种点云处理模型,我们以训练效果较好的MSG算法为例给出训练自己模型的方法。

2.2.3 数据预处理

我们的点云数据可能与模型需要的数据不符,所以需要自己编写脚本进行数据的规范化。标准的点云数据处理的格式如下:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 其只包含了点云的(x,y,z)坐标以及每个点对应的标签。而可能我们从CloudCompare中导出的数据有四列数据还有一列点云的强度信息:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 所以编写如下的脚本对多余的第四列数据进行去除(文件的具体路径自己设置):

# -*- coding:utf-8 -*-
import os
filePath = 'D:\\点云数据处理小组\\pointnet-my\\data\\shapenetcore_partanno_segmentation_benchmark_v0_normal\\03797390'
for i,j,k in os.walk(filePath):
    for name in  k:
        print(name)
        f = open(filePath+name)  # 打开txt文件
        line = f.readline()  # 以行的形式进行读取文件
        list1 = []
        while line:
            a = line.split()
            b = a[0:3]
            c = float(a[-1])
            print(c)
            if(float(a[-1])==36.0):
                c=2
            if(float(a[-1])==37.0):
                c=3
            b.append(c)
            list1.append(b)  # 将其添加在列表之中
            line = f.readline()
        f.close()
        print(list1)
        with open(filePath+name, 'w+') as file:
            for i in list1:
                file.write(str(i[0]))
                file.write(' '+str(i[1]))
                file.write(' ' + str(i[2]))
                file.write(' ' + str(i[3]))
                if(i!=list[-1]):
                    file.write('\n')
        file.close()
# path_out = 'test.txt'   # 新的txt文件
# with open(path_out, 'w+') as f_out:
#     for i in list1:
#         fir = '9443_' + i[0]       # 第一列加前缀'9443_'
#         sec = 9443 + int(i[1])     # 第二列数值都加9443
#         # print(fir)
#         # print(str(sec))
#         f_out.write(fir + ' ' + str(sec) + '\n')    # 把前两列写入新的txt文件

接着我们需要对划分训练集、测试集、验证集的json文件进行处理,由于我们采用的是自己的数据集,每一个txt的文件名与之前官方数据集中的文件名一定不一样,所以需要编写脚本对控制训练集、测试集、验证集读入的三个json文件进行修改。具体代码如下(路径名同样需要修改为自己的路径名):

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

import os
filePath = 'D:\\点云数据处理小组\\pointnet-my\\data\\shapenetcore_partanno_segmentation_benchmark_v0_normal\\03797390'
#####最后一行会出现一个, 报错!!!!!!!!!
######手动删除或改进程序
#####
file = '1.txt'
with open(file,'a') as f:
    f.write("[")
    for i,j,k in os.walk(filePath):
         for name in k:
              base_name=os.path.splitext(name)[0]  #去掉后缀 .txt
              f.write(" \"")
              f.write(os.path.join("shape_data/03797390/",base_name))
              f.write("\"")
              f.write(",")
    f.write("]")
f.close()

最后在实际程序运行时发现会由于含0的数据过多而导致模型分类不准确,如下:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 而根据具体项目的实际物理意义(这里的全0即表示未被激光探测到的位置,x,y,z坐标均标注为0),所以编写脚本程序对全0的部分进行去除:

# -*- coding:utf-8 -*-
import os
filePath = 'D:\\点云数据处理小组\\pointnet-my\\data\\shapenetcore_partanno_segmentation_benchmark_v0_normal\\03797390'
for i,j,k in os.walk(filePath):
    for name in  k:
        list1 = []
        for line in open(filePath+name):
            a = line.split()
            #print(a)
            b = a[0:6]
            #print(b)
            a1 =float(a[0])
            a2 =float(a[1])
            a3 =float(a[2])
            #print(a1)
            if(a1==0 and a2==0 and a3==0):
                continue
            list1.append(b[0:6])
        with open(filePath+name, 'w+') as file:
            for i in list1:
                file.write(str(i[0]))
                file.write(' '+str(i[1]))
                file.write(' ' + str(i[2]))
                file.write(' ' + str(i[3]))
                file.write(' ' + str(i[4]))
                if(i!=list[-1]):
                    file.write('\n')
        file.close()

2.2.4  选择模型进行修改

我们打开项目文件夹下的model文件夹,选择以pointnet2_part_seg_msg为名的python文件,双击进入:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 接下来我们需要修改的地方为PointNetFeaturePropagation的in_channel,具体方法为128+4*分割的总类个数,比如这里我们的分割采用的是两个物体,每个物体均为2分类,所以通道数为128+4*2=136:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 接着我们需要修改独热编码部分,将view方法中的第二个参数修改为需要被分割的物体的种类数:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 2.2.5 训练模型部分的修改

在训练模型的时候,我们需要修改要分类的对象seg_classes为我们自己的数据集对应的类别,如例子中的分类两个类别,每个类别有两个部件。(为了方便,我们保留了原来的'Airplane': [0, 1], 'Mug': [2, 3]这两个名字,同时应该注意,编号应该从0开始依次编号,若不是这样则会报错),同时应该注意自己的电脑是否支持cuda加速,如果没有GPU,则可以把代码后面所有的".cuda()"删去,程序才能正确运行。

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 接下来我们需要修改分割的物体总数num_classes为自己的类别个数,总共的部件数为自己的总个数:num_part。

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

最后,右键运行程序,如果出现进度条则表明模型已经成功改进,可以跑通自己的数据集啦!

 pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 三、如何将模型预测得到的数据打印出来?

我们在用自己的数据集训练完模型后,将利用名为test_partseg的python文件进行模型的测试,为了更好的理解模型以及测试模型效果,我们有时需要打印出模型预测后的点云坐标。这里给出test_partseg文件的修改方法以及运行结果。

3.1 测试模型代码修改

首先我们需要找到该python文件,接着与上面同样的修改如下图的两个地方: 

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

接着我们需要编写代码打印出分类后的具有不同标签的坐标,本例子中要打印两个物体的四个类别的坐标点,代码如下(部分代码):

                for j in aaa:
                    #print(points1[i,j])

                    res1= open(r'E:\03797390_0_'+str(i)+'.txt', 'a')
                    res1.write('\n' + str(points1[i,j]).strip('[]'))
                    res1.close()
                    xxxxxx=xxxxxx+1

                bbb = numpy.argwhere(cur_pred_val[i] == 1)
                for j in bbb:
                    #print(points1[i, j])

                    res2 = open(r'E:\03797390_1_' + str(i) + '.txt', 'a')
                    res2.write('\n' + str(points1[i,j]).strip('[]'))
                    res2.close()
                    xxxxxx = xxxxxx + 1

                ccc = numpy.argwhere(cur_pred_val[i] == 2)
                for j in ccc:
                    #print(points1[i, j])

                    res3 = open(r'E:\02691156_2_' + str(i) + '.txt', 'a')
                    res3.write('\n' + str(points1[i,j]).strip('[]'))
                    res3.close()
                    xxxxxx = xxxxxx + 1

                ddd = numpy.argwhere(cur_pred_val[i] == 3)
                for j in ddd:
                    #print(points1[i, j])

                    res4 = open(r'E:\02691156_3_' + str(i) + '.txt', 'a')
                    res4.write('\n' + str(points1[i,j]).strip('[]'))
                    res4.close()
                    xxxxxx = xxxxxx + 1

修改完成后运行程序发现可以显示结果,表明修改成功!

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 打印出的点云坐标格式如下:

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

pointnet 数据,点云算法,机器学习,人工智能,神经网络,算法,数据分析

 最后如果需要代码或者点云数据资源的小伙伴可以私信我哦!文章来源地址https://www.toymoban.com/news/detail-778206.html

到了这里,关于用pointnet++分类自己的点云数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于深度学习方法的点云算法1——PointNetLK(点云配准)

    请点点赞,会持续更新!!! 基于深度学习方法的点云算法2——PointNet(点云分类分割) 基于深度学习方法的点云算法3——PointNet++(点云分类分割) 基于深度学习方法的点云算法4——PCT: Point Cloud Transformer(点云分类分割) 作者将PointNet看成一个可学习的成像函数(learn

    2024年02月10日
    浏览(43)
  • 使用 PointNet 进行3D点集(即点云)的分类

    无序3D点集(即点云)的分类、检测和分割是计算机视觉中的核心问题。此示例实现了开创性的点云深度学习论文PointNet(Qi 等人,2017)。 如果使用 colab 首先安装 trimesh  !pip install trimesh 。

    2024年02月07日
    浏览(40)
  • Pytorch1.7复现PointNet++点云分割(含Open3D可视化)(文末有一个自己做的书缝识别项目代码)

      毕设需要,复现一下PointNet++的对象分类、零件分割和场景分割,找点灵感和思路,做个踩坑记录。 https://github.com/yanx27/Pointnet_Pointnet2_pytorch   我的运行环境是pytorch1.7+cuda11.0。   PointNet++代码能实现3D对象分类、对象零件分割和语义场景分割。 对象分类   下载数据

    2023年04月15日
    浏览(85)
  • 机器学习基础08-模型选择02-分类算法矩阵(基于Pima 数据集)

    算法评估矩阵(Algorithm Evaluation Metrics)用于评估机器学习算法在特定任务上的 性能 。不同的任务可能会使用不同的评估矩阵,因为每个任务的优劣衡量标准都不同。 分类问题或许是最常见的机器学习问题,并且有多种评估矩阵来评估 分类算法。以下几种用来评估分类算法

    2024年02月14日
    浏览(49)
  • 【机器学习案例】不同的模型算法对鸢尾花数据集进行分类

    经典机器学习入门项目,使用逻辑回归、线性判别分析、KNN、分类与回归树、朴素贝叶斯、向量机、随机森林、梯度提升决策树对不同占比的训练集进行分类 数据源 :Iris Species | Kaggle 150行,5列,分三种鸢尾花类型,每种类型50个样本,每行数据包含花萼长度、花萼宽度、花

    2024年02月04日
    浏览(33)
  • 机器学习基础09-审查分类算法(基于印第安糖尿病Pima Indians数据集)

    算法审查是选择合适的机器学习算法的主要方法之一。审查算法前并 不知道哪个算法对问题最有效,必须设计一定的实验进行验证,以找到对问题最有效的算法。本章将学习通过 scikit-learn来审查六种机器学习的分类算法,通过比较算法评估矩阵的结果,选择合适的算法。 审

    2024年02月11日
    浏览(41)
  • 【机器学习 | 朴素贝叶斯】朴素贝叶斯算法:概率统计方法之王,简单有效的数据分类利器

    🤵‍♂️ 个人主页: @AI_magician 📡主页地址: 作者简介:CSDN内容合伙人,全栈领域优质创作者。 👨‍💻景愿:旨在于能和更多的热爱计算机的伙伴一起成长!!🐱‍🏍 🙋‍♂️声明:本人目前大学就读于大二,研究兴趣方向人工智能硬件(虽然硬件还没开始玩,但一直

    2024年02月15日
    浏览(56)
  • 机器学习与深度学习——通过knn算法分类鸢尾花数据集iris求出错误率并进行可视化

    什么是knn算法? KNN算法是一种基于实例的机器学习算法,其全称为K-最近邻算法(K-Nearest Neighbors Algorithm)。它是一种简单但非常有效的分类和回归算法。 该算法的基本思想是:对于一个新的输入样本,通过计算它与训练集中所有样本的距离,找到与它距离最近的K个训练集样

    2024年02月03日
    浏览(41)
  • PointNet++训练自己的数据集(附源码)

    本文针对PointNet++强大的三维点云分类功能,详细讲解怎么训练自己的数据集,在此之前,需要确保已经能够跑通源码的训练和测试,如果没有,请参考PointNet++的源码运行。 1.1. 在mytensor_shape_names.txt中配置自己的分类,以及分类名称: 1.2. 在filelist.txt中填入对应的不同类别的

    2024年01月20日
    浏览(37)
  • 1.机器学习-机器学习算法分类概述

    🏘️🏘️个人主页:以山河作礼。 🎖️🎖️: Python领域新星创作者,CSDN实力新星认证,CSDN内容合伙人,阿里云社区专家博主,新星计划导师,在职数据分析师。 🎉🎉 免费学习专栏 : 1. 《Python基础入门》——0基础入门 2.《Python网络爬虫》——从入门到精通 3.《Web全栈开

    2024年01月18日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包