地理空间人工智能 (GeoAI) 是一门新兴的科学学科,它结合了空间数据科学、机器和深度学习中的方法,从空间大数据中提取知识(Janowicz 等人,2019 年)。它是一个活跃的研究领域,在许多领域都有应用,例如:灾害管理、城市规划、物流、零售、太阳能等(Ballesteros 等人,2021 年)。与此同时,卫星的可用性和质量迅速提高,最近无人机图像、其易用性以及消费者和专业无人机的实惠价格正在使这些技术融合。
人们可能会认为 GeoAI 将大量算法应用于高空图像分析,但事实是这些算法仅总结为四种,它们是称为人工神经网络 (NN) 的通用函数的变体。神经网络是由人工神经元组合而成的分层结构。NN 的研究称为深度学习,它们作为输入 X 和输出值之间的映射函数 Y = F(X)。
本文简要介绍了这些算法及其应用。
1.图像分类
图像的对象或多对象分类,警告输入图像中特定对象组的存在与否,而无需计算对象在图像中的位置。卷积神经网络 (CNN) 是用于解决图像分类问题的默认网络架构,这些神经网络在移动内核和图像像素值之间执行标量积。标量积也称为卷积,允许根据位置、角度或大小对图像中的对象进行分类。使用了许多内核或过滤器,并且网络的权重或参数由网络自动计算并重新计算,使用通过层的反向传播中的预期值和获得值之间的比较。第一层计算物体的一般几何特征,如对角线和垂直线等,下一层定义更复杂和聚合的形式,最后,根据对象类的数量,网络的输出对应于可伸缩的神经元数量。图 1 显示了此架构的示例 [1]。
图 1. 查看图像中上部的 6x6、3x3 和 4x4 内核。[1]
有一个图像分类的扩展版本,这是当网络而不是概率输出用于命名图像中现有对象的文本时。这称为图像说明。
2. 物体检测或识别
以与图像分类类似的方式,检测模型在图像中找到对象,但它们的位置由矩形区域框起来。此外,还提到了每个特定对象存在的概率。
图 2. 人体检测数据集。图片由作者提供
图 3. 交通标志检测数据集。图片由作者提供
3.图像语义分割
语义分割是对图像的每个像素进行分类。像素以颜色编码的类别分开。执行此任务的深度学习模型使用颜色掩码作为感兴趣对象的标签,或者在只有一个类分割的情况下使用二进制掩码(黑色和白色)。由于这是像素级别的分类,因此它是一种比以前的算法对计算能力要求更高的算法。科学家们比较了不同的人工神经网络架构,目的是找到最佳性能。U-Net [2] 最初是为医学图像开发的,在过去几年中一直在语义分割的指标得分中名列前茅。
图 4.U-Net。修改自 [2]
图 5. 多类语义分割数据集,Drone Deploy Benchmark
图 6. 二元掩码,Massachussets Road 数据集
4.图像生成
图像生成是从随机空间中获取图像的过程,即获取与一组图像的现有分布特征似是而非的合成图像。图像生成的主要应用是为模型训练、计算机图形学和设计等创建合成数据(Isola 等人,2017 年)。图像生成通常由生成模型执行,这些模型有两种,无论是明确编程还是使用监督学习创建。最新的使用了两个 CNN,一个在像素级别对输入图像进行分类(一种语义分割),另一个对第一个进行的像素分类过程进行限定。这两个网络以对抗方式工作,这就是它们被称为“生成对抗网络 (GAN)”的原因。
图 7. 图像到地图的转换
图像的应用、领域和类型
图 8 总结了四种算法的统计比例、它们的应用领域以及所使用的传感器或图像类型 [3]。
图 8. 修改自 [3] 的图像
结论
GeoAI 主要使用四种算法来分析高空图像,它们是:图像分类、目标检测、语义分割和图像生成。
所有四种重新审视的算法及其架构都基于 CNN,CNN 是一种人工神经网络,使用卷积来应用于像素,卷积是移动窗口标量积。
GeoAI 的大部分论文都是针对对象检测(~54%),然后是分割(~41%),图像分类(~5%),最后是图像生成(不到 1%)。
主要应用领域是环境(46%)、城市(27%)和农业(26%)、其他(1%)。文章来源:https://www.toymoban.com/news/detail-517118.html
大多数用于分析的图像是 RGB (52%)、多光谱 (24%)、高光谱 (18%) 和激光雷达 (6%)。文章来源地址https://www.toymoban.com/news/detail-517118.html
到了这里,关于GeoAI 的4个主要应用领域的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!