Python空间分析| 01 利用Python计算全局莫兰指数(Global Moran‘s I)

这篇具有很好参考价值的文章主要介绍了Python空间分析| 01 利用Python计算全局莫兰指数(Global Moran‘s I)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

全局空间自相关

空间自相关(spatial autocorrelation)是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性。Tobler(1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”

全局莫兰指数(Global Moran’s I)是最常用的空间自相关指数,用来反映全局的空间相关性,其计算公式为:

I = f r a c N W f r a c s u m _ i s u m _ j w i j ( x _ i − b a r x ) ( x _ j − b a r x ) s u m _ i ( x _ i − b a r x ) 2 I = \\frac N W \\frac {\\sum\_i \\sum\_j w_{ij} (x\_i-\\bar x) (x\_j-\\bar x)} {\\sum\_i (x\_i-\\bar x)^2} I=fracNWfracsum_isum_jwij(x_ibarx)(x_jbarx)sum_i(x_ibarx)2

式中, N N N表示空间单元的数量, i i i j j j表示空间单元的位置索引, x x x为分析的变量, b a r x \\bar x barx表示分析变量的均值, w i j w_{ij} wij表示空间权重矩阵, W W W表示空间权重矩阵的和

Moran’s I大于0时,表示数据呈现空间正相关,其值越大空间相关性越明显;Moran’s I小于0时,表示数据呈现空间负相关,其值越小空间差异越大;Moran’s I为0时,空间呈随机性

解读莫兰指数的时候,需要有P值和Z得分来判定,P值小于0.05(通过95%置信度检验),且Z得分超过临界值1.65(拒绝零假设设定的阈值)

工具介绍

  • PySAL是一个基于Python进行探索性空间数据分析的开放源码库,是由亚利桑那州立大学GeoDa Center for Geospatial Analysis and Computation赞助的社区项目

  • libpysal:是Python空间分析库核心库,它提供了四个模块,构成了PySAL系列的空间分析工具:

    • 空间权重: libpysal.weights

    • 输入和输出:libpysal.io

    • 计算几何学:libpysal.cg

    • 内置示例数据集 libpysal.examples

  • esda 是一个用于空间数据探索性分析的开放源码 Python 库,它是 PySAL (Python Spatial Analysis Library)的一个子包,包括全局和局部空间自相关分析的方法。

import esda  
import pandas as pd
import geopandas as gpd
from geopandas import GeoDataFrame
import libpysal as lps
import numpy as np
import matplotlib.pyplot as plt
from shapely.geometry import Point
import contextily as ctx
from pylab import figure, scatter, show
%matplotlib inline

root_dir="/root/learning/pysal/实验1/"
gdf = gpd.read_file(root_dir+'data/econ90040212.shp') # 读取数据

数据概况

gdf.columns.values  #字段名
array(['CODE', 'COUNT', 'SUM_AREA', 'FIRST_ANAM', 'OID_', 'CODE_1',
       'DATAFLAG', 'TOTPOP', 'TOTPOP_10K', 'RURPOP_10K', 'TOWNPOP_10',
       'AGRPRODUCT', 'AGRLBR_10K', 'AGRSTOTGDP', 'FSTGDPRATE',
       'SCNDGDPRAT', 'THRDGDPRAT', 'Province', 'geometry'], dtype=object)


gdf.head(1) # 查看一条记录

莫兰指数lisa图绘制python,Python空间分析,python

计算全局空间自相关指数Moran’s I

  • 第一产业占GDP比重FSTGDPRATE为变量
ax=gdf.plot(figsize=(8,8),column="FSTGDPRATE")
ax.set_axis_off()

莫兰指数lisa图绘制python,Python空间分析,python

可以看出有一定的空间聚集性,但聚集性程度的大小需要通过Moran’s I的计算进一步衡量

计算空间权重矩阵

df = gdf
wq =  lps.weights.Queen.from_dataframe(df)# 使用Quuen式邻接矩阵
wq.transform = 'r' # 标准化矩阵
('WARNING: ', 98, ' is an island (no neighbors)')
('WARNING: ', 108, ' is an island (no neighbors)')
('WARNING: ', 137, ' is an island (no neighbors)')
('WARNING: ', 138, ' is an island (no neighbors)')
('WARNING: ', 139, ' is an island (no neighbors)')


/usr/local/lib/python3.6/dist-packages/libpysal/weights/weights.py:172: UserWarning: The weights matrix is not fully connected: 
 There are 6 disconnected components.
 There are 5 islands with ids: 98, 108, 137, 138, 139.
  warnings.warn(message)

可以看到有5个单元没有邻接对象

接下来将计算得到的权重矩阵绘制出来进行观察

centroids = gdf.geometry.centroid # 计算多边形几何中心
fig = figure(figsize=(8,8))

plt.plot(centroids.x, centroids.y,'.')
for k,neighs in wq.neighbors.items():
    #print(k,neighs)
    origin = centroids[k]
    for neigh in neighs:
        segment = centroids[[k,neigh]]
        plt.plot(segment.x, segment.y, '-')
plt.title('Queen Neighbor Graph')
plt.axis('off')
plt.show()

莫兰指数lisa图绘制python,Python空间分析,python

wr =  lps.weights.Rook.from_dataframe(df) # 使用Rook式邻接矩阵
# wr.transform = 'r' # 标准化矩阵
fig = figure(figsize=(8,8))

plt.plot(centroids.x, centroids.y,'.')
for k,neighs in wr.neighbors.items():
    #print(k,neighs)
    origin = centroids[k]
    for neigh in neighs:
        segment = centroids[[k,neigh]]
        plt.plot(segment.x, segment.y, '-')
plt.title('Rook Neighbor Graph')
plt.axis('off')
plt.show()

莫兰指数lisa图绘制python,Python空间分析,python

计算Moran’I

y=gdf["FSTGDPRATE"]
mi = esda.moran.Moran(y, wq)

print("Moran's I 值为:",mi.I)
print("随机分布假设下Z检验值为:",mi.z_rand)
print("随机分布假设下Z检验的P值为:",mi.p_rand)
print("正态分布假设下Z检验值为:",mi.z_norm)
print("正态分布假设下Z检验的P值为:",mi.p_norm)
Moran's I 值为: 0.7133088262106428
随机分布假设下Z检验值为: 16.7858372659958
随机分布假设下Z检验的P值为: 0.0
正态分布假设下Z检验值为: 16.826039087303325
正态分布假设下Z检验的P值为: 0.0

p<0.001,说明能够在99.9%的置信度下证明GDP中第一产业占比存在空间聚集性,空间相关性显著

绘制Moran’s I散点图

Moran散点图分为四个象限,分别表示四种局部空间相关关系:

  • 第一象限(HH):高值区被高值包围
  • 第二象限(LH):低值区被高值包围
  • 第三象限(LL):低值区被低值包围
  • 第四象限(HL):高值区被低值包围
from splot.esda import plot_moran
plot_moran(mi, zstandard=True, figsize=(10,4))
plt.show()

莫兰指数lisa图绘制python,Python空间分析,python

根据概率分布图,可以看出莫兰指数的值远大于大于随机正态分布的期望,这表明空间现象并不是随机分布的,而是具有一定相关性

根据散点图结果,可以看出全局Moran’s I 指数为0.708,并且大于0.5,因此其空间相关性较高文章来源地址https://www.toymoban.com/news/detail-812086.html

参考链接

  • https://pysal.org/libpysal/
  • https://pysal.org/esda/index.html
  • https://github.com/pysal/esda
  • http://pysal.org/notebooks/viz/splot/esda_morans_viz.html
  • http://darribas.org/gds_scipy16/ipynb_md/04_esda.html
  • https://splot.readthedocs.io/en/stable/users/tutorials/autocorrelation.html

到了这里,关于Python空间分析| 01 利用Python计算全局莫兰指数(Global Moran‘s I)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包