波士顿犯罪数据时空分析及可视化

这篇具有很好参考价值的文章主要介绍了波士顿犯罪数据时空分析及可视化。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


前言

波士顿作为美国马萨诸塞州的首府和最大城市,美国新英格兰地区最重要的城市,被称为美国的雅典,是公认的世界性大城市,长期以来却被犯罪问题所困扰。选取的数据集由波士顿警察局提供,其中记载了波士顿市2015年到2018年犯罪案例。根据其中信息,可以针对波士顿城市犯罪问题展开相关分析研究。

数据来源:https://www.kaggle.com/datasets/AnalyzeBoston/crimes-in-boston

一、数据描述

数据集共319073条数据,由17个特征字段组成

INCIDENT_NUMBER 事件编号
OFFENSE_CODE 犯罪代码
OFFENSE_CODE_GROUP 犯罪代码组
OFFENSE_DESCRIPTION 犯罪行为描述
DISTRICT 犯罪地区
REPORTION_AREA 犯罪报告区域
SHOOTING 是否发生枪击
OCCURRED_ON_DATE 犯罪发生日期
YEAR 年份
MONTH 月份
DAY_OF_WEEK 星期
HOUR 小时
UCR_PART 案件发生警区
STREET 案件发生街道
Lat 纬度
Long 经度
Location 位置

二、数据预处理

missingno是一个可以将缺失值情况进行可视化的第三方库,利用该库查看数据集特征值缺失情况
代码如下(示例):

%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
import seaborn as sns
myfont1 = FontProperties(fname = "simhei.ttf",size=18)
myfont2 = FontProperties(fname = "simhei.ttf",size=12)
#导入数据集
crime_boston = pd.read_excel(r'D:\dataset\crime.xlsx',sheet_name='crime')
#绘制缺失值热图
import missingno as msno
msno.matrix(crime_boston,labels=True)

结果如下:
波士顿犯罪数据时空分析及可视化

三、犯罪时空分析

1.犯罪类型分析

数据集中“OFFENSE_CODE_GROUP”(犯罪代码组)特征对犯罪类型划分粒度较为合适,因此选定该字段作为各犯罪类型划分标准。通过groupby()函数对犯罪类型进行分类汇总,共计67种分类。

df = crime_boston.groupby('OFFENSE_CODE_GROUP').count()

为了方面后续制图,整理了分类汇总的结果为Excel表格(为了方面后续制图,可以将结果升序排列,为了操作简单,我直接在Excel中进行的排序操作)
波士顿犯罪数据时空分析及可视化
作为crime_type导入
波士顿犯罪数据时空分析及可视化
调用PyEcharts第三方库对犯罪类型及其数量进行可视化展示

type_ls = []
for i in crime_type['type']:
    type_ls.append(i)

num_ls = [] 
for i in crime_type['numbers']:
    num_ls.append(i)

from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker
from pyecharts.globals import ThemeType
c = (
    Bar(init_opts=opts.InitOpts(width="1100px", height="1000px",theme=ThemeType.ESSOS))
    .add_xaxis(type_ls)
    .add_yaxis("犯罪数量", num_ls)
    .reversal_axis()
    .set_global_opts(title_opts=opts.TitleOpts(title="2015年-2018年波士顿犯罪类型及其数量"))
    .set_series_opts(label_opts=opts.LabelOpts(position="right"))
)
c.render_notebook()

结果如图所示
波士顿犯罪数据时空分析及可视化
通过图可以看出,盗窃罪以25935起的数量,成为波士顿市发生频率最高的犯罪类型;其他类型犯罪包括非法侵入他人住宅、绑架未遂、对他人威胁造成身体伤害等,这个罪名以18075起的数量位列第二;排名前五的罪名还有药物违规、简单暴力罪和故意破坏公共财物罪。生物威胁罪、入室盗窃、贩卖人口、赌博等犯罪在波士顿市案发较少。

2.犯罪时间特征分析

(1)基于年维度

首先查看波士顿市犯罪数量随年份变化情况,绘制南丁格尔玫瑰图进行展示

course = ['2015年','2016年','2017年','2018年']
score = [53388,99114,100886,65685]
c = (
    Pie()
    .add("",[list(z) for z in zip(course,score)],radius=["10%","75%"],rosetype='area')
    .set_global_opts(title_opts=opts.TitleOpts(title='不同年份的犯罪数量',pos_top='10%',pos_left='40%'),
                     legend_opts=opts.LegendOpts(type_="scroll",pos_top='20%',pos_left='81%',orient='vertical'))
    .set_series_opts(label_opts = opts.LabelOpts(formatter='{b}:{c}'))
)
c.render_notebook()

波士顿犯罪数据时空分析及可视化
数据集记录的时间跨度为2015年6月15日到2018年9月3日,2015年、2018年的数据不完整,因此在该维度着重分析2016年和2017年数据。结果显示,2017年犯罪总数同比增长1.79%。
接下来将视角由犯罪整体情况维度转向不同的犯罪类型,同样利用groupby()函数进行汇总分析。结果显示,2016年、2017年报告记录犯罪类型分别为65种、66种,2017年比2016年多出一项赌博犯罪,共报告6例;入室盗窃未遂仅在2016年被报告,生物威胁类犯罪仅发生在2017年。对2016年、2017年共有的犯罪类型变化趋势进一步分析,查看犯罪类型数量变化。
还是为了后续制图方便,把汇总结果放在Excel表里
波士顿犯罪数据时空分析及可视化
导入表格为crime_change,选取数量变化较大的犯罪类型绘制正负条形图

plt.rcParams['axes.unicode_minus']=False
sns.set(style="ticks") 

color=pd.cut(crime_change["change"],[-600,0,700],labels=["b","r"]) #对不同区间进行颜色划分
xs=np.arange(len(color))
fig,ax=plt.subplots(figsize=(10,6))
plt.barh(xs,crime_change["change"],height=0.6,color=color)
plt.yticks(xs,crime_change["type"],fontproperties=myfont2)
# yticks = mtick.FormatStrFormatter("%.1f%%")
# ax.yaxis.set_major_formatter(yticks)
plt.xlabel("数量变化",fontproperties=myfont2)
plt.title("不同犯罪类型数量增减变化",fontproperties=myfont1)
# ax.yaxis.grid(True) # y坐标轴的网格使用主刻度
for item in ['top', 'right', 'left',"bottom"]:
    ax.spines[item].set_visible(False) #去掉边框
# plt.savefig('barchar24.png', dpi=1000, transparent=True)
# plt.show()

波士顿犯罪数据时空分析及可视化
通过图5可以直观地看出药物违规滥用犯罪数量减少最多,共减少525起,同比下降9.94%。财产类犯罪调查数量增长最多,共增加618起,同比增长18%。以变化率来看,贩卖人口、车牌类犯罪、酒类犯罪、贪污罪以及卖淫犯罪增幅最大,同比增长率分别为150%、36.55%、28.78%、28.57%以及24.29%;降幅最大的五类犯罪有爆炸罪、过失致人死亡罪、非法集会、刑事骚扰罪以及无证经营罪,同比下降率分别为71.05%、40%、27.03%、20%以及16.07%。

波士顿市经济发达、生活水平较高,私家车普及率较高,因此车牌类犯罪、酒后驾驶罪等围绕车辆的犯罪数量出现增长;作为马萨诸塞州首府,波士顿在马萨诸塞州政治生活中扮演着中演角色。波士顿有着大量的行政、司法机关,相应官员数量也较多,这难免会使贪污罪、财产类犯罪调查数量出现增长。结合实际,权色问题往往相伴出现,一些腐败分子手中的权力会让他们的欲望更加膨胀,这给卖淫人员提供了大量犯罪机会,在贪利动机的促使下,越来越多的女性走上了卖淫犯罪的道路。

(2)基于月维度

依旧还是分类汇总

crime_month= crime_boston.groupby('MONTH').count()

波士顿犯罪数据时空分析及可视化

绘制日历热图对犯罪数量进行可视化展示

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt 
import calmap

fig,ax=calmap.calendarplot(crime_month['INCIDENT_NUMBER'],  fillcolor='grey', 
                           linecolor='w',linewidth=0.1,cmap='RdYlBu_r',
                           yearlabel_kws={'color':'black', 'fontsize':12},
                            fig_kws=dict(figsize=(10,6),dpi= 80))
fig.colorbar(ax[0].get_children()[1], ax=ax.ravel().tolist())
plt.show()

波士顿犯罪数据时空分析及可视化
PS:热力图风格类型我放到这里啦,需要调整日历热力图风格的小伙伴们可以选择自己喜欢的

'Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r',
'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r', 
'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r', 
'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 'Pastel2_r', 
'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 'PuOr_r', 'PuRd', 
'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy', 'RdGy_r', 'RdPu', 'RdPu_r',
'**RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds', 'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r',
'Set3', 'Set3_r', 'Spectral', 'Spectral_r', 'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu',
'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd', 'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn',
'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r', 'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis',
'cividis_r', 'cool', 'cool_r', 'coolwarm', 'coolwarm_r', 'copper', 'copper_r', 'crest', 'crest_r', 'cubehelix',
'cubehelix_r', 'flag', 'flag_r', 'flare', 'flare_r', 'gist_earth', 'gist_earth_r', 'gist_gray', 
'gist_gray_r', 'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r', 
'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r', 'gnuplot_r',
'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'icefire', 'icefire_r', 'inferno', 'inferno_r', 'jet',
'jet_r', 'magma', 'magma_r', 'mako', 'mako_r', 'nipy_spectral', 'nipy_spectral_r', 'ocean', 'ocean_r', 
'pink', 'pink_r', 'plasma', 'plasma_r', 'prism', 'prism_r', 'rainbow', 'rainbow_r', 'rocket', 'rocket_r', 
'seismic', 'seismic_r', 'spring', 'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r',
'tab20b', 'tab20b_r', 'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r', 
'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'vlag', 'vlag_r', 'winter', 'winter_r'

四个年份的犯罪数据链变化及走势基本相同,从初夏的5月到初秋的9月均处在犯罪的高峰期,自11月份入冬起到次年2月份形成一个犯罪低谷期。由此可以认为,波士顿市的犯罪在总体上具备一定的季节性特征。
基于常规逻辑认识,一般认为盗窃罪、暴力犯罪、强奸罪数量变化与季节变化相关性较强,由于数据集中缺少强奸罪的犯罪记录,因此下面将对盗窃罪和暴力犯罪的季节性特征进一步探索。
由于原始数据集中”OCCURRED_ON_DATE“字段包含时间点,不方便后续可视化,所以我把原来的时间点信息去掉,将原来的数据存入到了一个新的Excel表格(crime_month)中(虽然麻烦些,但能抓老鼠的就是好猫!)

crime_month = pd.read_excel(r'D:D:\dataset\crime.xlsx',sheet_name='crime_month')

使用时间序列分解法进行分析,得到盗窃罪的长期趋势、季节性变化以及残差散点图

#盗窃罪时间序列分解
larceny = crime_month[crime_month['OFFENSE_CODE_GROUP']=='Larceny']
larceny = larceny.groupby('OCCURRED_ON_DATE').count()
larceny = larceny.iloc[:,0:1]
# decomposition时间序列分解
from statsmodels.tsa.seasonal import seasonal_decompose
#model : {"additive", "multiplicative"}, optional,加法模型,乘法模型
result = seasonal_decompose(larceny, model='additive')
# 添加图像标题,x,y为浮点型,表示标题在图像水平、垂直方向相对位置
result.plot().suptitle('盗窃罪时间序列分解',x=0.55, y=1.04, fontsize=16, color='k',fontproperties=myfont2)

波士顿犯罪数据时空分析及可视化
盗窃罪在10月到12月的冬季和初春3月迎来两次数量高峰。波士顿属温带大陆性气候,全年四季分明,冬有严寒、夏有酷暑。冬季和初春时分,人们穿着较厚,对行窃行为感知程度低,盗窃犯罪更易得手,这也使得这段时期成为盗窃犯罪的高发期。
使用同样的时间序列分解方法,对暴力犯罪(攻击+抢劫)进行季节性分析。
波士顿犯罪数据时空分析及可视化
暴力犯罪(攻击+抢劫)高发期出现在每年的夏季,以5月份为最。春夏之际,随着气温回暖,人们户外活动量增加,活动空间范围扩大,这间接增加了人与人之间发生冲突的可能性,加之温度的升高不利于人的情绪稳定,诱发暴力犯罪的因素叠加,使得暴力犯罪的数量随着温度的升高也出现增长。

(3)基于日维度

犯罪现象不仅受季节变换影响,随着白昼黑夜交替,犯罪数量及表现形态也因时而异,呈现出一定的时间规律性,下面研究波士顿市一日当中的整体发案情况,调用pyecharts绘制折线图

crime_day = crime_boston.groupby('HOUR').count()
y = []
for i in crime_day['INCIDENT_NUMBER']:
    y.append(i)
ls=crime_day.index.values.tolist()
x=[]
for i in ls:
    i=str(i)+'时'
    x.append(i)
#绘制折线图
import pyecharts.options as opts
from pyecharts.charts import Line
line=(
    Line()
    .add_xaxis(xaxis_data=x)
    .add_yaxis(series_name="案发数量",y_axis=y)
    .set_series_opts(
        markarea_opts=opts.MarkAreaOpts(
            data=[
                opts.MarkAreaItem(name="案发低谷期", x=("3时", "6时")),
                opts.MarkAreaItem(name="平台期", x=("10时", "15时")),
                opts.MarkAreaItem(name="案发高峰期", x=("16时", "19时")),
            ]
        )
    )
    .set_global_opts(title_opts=opts.TitleOpts(title="犯罪数量逐时变化"),
                    visualmap_opts=opts.VisualMapOpts(
            is_piecewise=True,
            dimension=0,
            pieces=[
                {"gt": 0, "lte": 3, "color": "green"},
                {"gt": 3, "lte": 6, "color": "#2874B2"},
                {"gt": 6, "lte": 10, "color": "#F7BA0B"},
                {"gt": 10, "lte": 15, "color": "orange"},
                {"gt": 15, "lte": 19, "color": "red"},
                {"gt": 19, "color": "green"},
            ],
            pos_right=0,
            pos_bottom=100
        )
                    )

)
line.render_notebook()

波士顿犯罪数据时空分析及可视化
一天之中的犯罪数量变化趋势与人们作息规律大致吻合。凌晨3时到6时是一天之中的案发低谷期;随着白昼的到来,人的活动性增强,人与人之间接触交流增多,6时到10时犯罪数量一路攀升,增长率达225.2%;10时到15时迎来平台期,除去12时犯罪数量陡增,其余时刻案发数量均在16500起左右;16时至19时是一天中案发的高峰期,其中17时案发数量最多;19时之后到次日3时,犯罪数量逐时减少。
继续细化研究对象粒度,结合犯罪类型分析盗窃罪、暴力类犯罪数量变化。

#四种盗窃类型的数量随小时的变化
daoqie = crime_boston[crime_boston['OFFENSE_CODE_GROUP']=='Larceny']
daoqie = daoqie.groupby('HOUR').count()
y1=[]
for i in daoqie['INCIDENT_NUMBER']:
    y1.append(i)
#入室盗窃、商业类盗窃、车辆盗窃y的汇总方式与上面相同
fig,ax=plt.subplots(nrows=2,ncols=2,figsize=(12,8),dpi=1000)
plt.subplot(2, 2, 1)
x = ['0时', '1时', '2时', '3时', '4时', '5时', '6时', '7时', '8时', '9时', '10时', '11时', '12时', '13时', '14时', '15时', '16时', '17时', '18时', '19时', '20时', '21时', '22时', '23时']
plt.plot(x,y1,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y1,width=0.6,color='teal')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)

plt.subplot(2, 2, 2)
plt.plot(x,y2,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y2,width=0.6,color='#F7BA0B')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('入室盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)

plt.subplot(2, 2, 3)
plt.plot(x,y3,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y3,width=0.6,color='#D4652F')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('车辆盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)

plt.subplot(2, 2, 4)
plt.plot(x,y4,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y4,width=0.6,color='#2874B2')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('商业区盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)

# plt.savefig(fname="pic.png",figsize=[8,8])
plt.show()

波士顿犯罪数据时空分析及可视化
这四类案件同属盗窃类案件,在案发时间规律上有着相似性和差异性。

盗窃案件和入室盗窃案件数量变化趋势较为相似,案件高发时段分别为12时到18时、8时到12时。犯罪分子实施盗窃行为难免需要与事主或其财物发生接触,12时到18时是一天当中人员流动性最大的时段,在这时实施盗窃行为更易伪装与隐蔽;8时到12时是人们出门上班、上学或活动的时段,家中无人照看,不法分子趁虚而入实施盗窃行为,这一时段也容易出现因疏忽大意未锁好门窗的情况,会给寻机作案者溜门而入的可乘之机;车辆盗窃案件高发期在18时到22时,这一时期是下班晚高峰时期,人们将车辆集中停靠至住宅附近,在夜幕的掩盖下,犯罪者更易穿梭隐蔽在车辆中实施盗窃行为,成功的可能性大大提升;商业区盗窃案件高发期在0时到7时,此时人员大多已经转移至住宅区,商业区人员稀少,且夜间社会防范力量有所减弱,犯罪分子更易得手。

暴力类案件(攻击+抢劫)时间规律与盗窃类案件不同,同样绘制折线图对其进行分析

fig,ax=plt.subplots(nrows=1,ncols=2,figsize=(12,5),dpi=1000)
plt.subplot(1, 2, 1)
x = ['0时', '1时', '2时', '3时', '4时', '5时', '6时', '7时', '8时', '9时', '10时', '11时', '12时', '13时', '14时', '15时', '16时', '17时', '18时', '19时', '20时', '21时', '22时', '23时']
plt.plot(x,y5,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y5,width=0.6,color='teal')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('攻击类案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)

plt.subplot(1, 2, 2)
plt.plot(x,y6,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y6,width=0.6,color='#F7BA0B')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('抢劫案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)

# plt.savefig(fname="pic.png",figsize=[8,8])
plt.show()

波士顿犯罪数据时空分析及可视化
攻击类案件包括故意伤害致人轻伤、故意伤害致人重伤罪及故意杀人罪三类统计数据,这类案件发生的高峰时段为16时至21时及凌晨0时至2时;在抢劫案件中,20时到22时及0时至2时是案件的高发期。结合作案环境来看,深夜凌晨作案有夜幕的掩护,易于隐藏躲避,这在一定程度上加强了犯罪分子的作案心理;从生理角度分析,夜间是人劳作一天之后最为疲惫的时期,警觉性降低,抵抗力减弱,难以抵御外来攻击或拦路劫财行为,许多暴力类犯罪因此发生。

3.犯罪空间特征分析

波士顿是美国最古老的城市之一,其定性较早,城市结构非常紧凑。波士顿可以划分为后湾区、市中心下城区、波士顿南端、波士顿东区、南波士顿滨水创新区、灯塔山社区、金融区等10个住宅区、8个商业区和6个工业区,有着纽伯里街(Newbury Street)、华盛顿街(Washington Street)、哈里森大道(Harrison Ave)及市场街(Market Street)四条商业街。波士顿是全美居民受教育程度最高的城市,举世闻名的哈佛大学和麻省理工学院都位于波士顿的都市区。不同的城市功能区有着不同的犯罪类型和数量分布,下面利用ArcGIS技术分析波士顿的犯罪空间分布格局。

使用ArcGIS符号系统中的热力图模式绘制热力图,首先是盗窃类型犯罪的热力图
波士顿犯罪数据时空分析及可视化
盗窃案件主要发生在两大区域。一是波士顿市后湾区,二是波士顿公园地区。

下面还绘制了同属盗窃大类案件中的车辆盗窃、入室盗窃案件的热力图。
波士顿犯罪数据时空分析及可视化
波士顿犯罪数据时空分析及可视化
车辆盗窃与入室盗窃在地区分布上有一定的相似性。后湾地区和下城中心区有着历史悠久的公寓楼和现代化的玻璃墙大楼,同样是这两类案件的高发区;紧挨着后湾区和下城区的波士顿南段(South End)是众多白领人士的家庭居住地,南段聚集着全美最多的维多利亚时期的红砖大楼,拥有着许多艺术中心和近30个公园,是波士顿宜居区之一,住房的集中必然也会导致车辆停靠的聚集,因此南段区域同样是车辆、入室盗窃案件的热点区域之一;波士顿西北角处还有一个热点区域,那一点是波士顿奥尔斯特区(Allston),该区被许多大学环绕,东北面有哈佛商学院以及哈佛大学的体育馆和球场,东南面有波士顿大学等,不仅如此该区还拥有着四通八达的交通和琳琅满目的美食,因此奥尔斯特区是许多青年大学生的首选居住地。大学生社会经验少,防范意识较差,易被犯罪分子视为侵害目标,这导致该区也有着大量犯罪行为。

药物滥用是波士顿市重点犯罪类型之一,因此同样对药物滥用案件进行了热力图绘制与分析
波士顿犯罪数据时空分析及可视化
药物滥用类案件主要分布在三个区域,分别是市中心的下城区、南段区以及西南部的蓝山湾地区。该类案件较盗窃类案件聚集区域性更加明显,经过交互查看,发现三个高发区有着共同的特点,那就是均在医疗、医院等机构附近。

人身伤害类案件与抢劫案是侵害人的生命健康权的严重暴力犯罪,针对该类案件做犯罪空间布局分析,不仅有利于保护公民生命健康权,还对维护社会治安稳定有着重要意义。
波士顿犯罪数据时空分析及可视化
波士顿犯罪数据时空分析及可视化
抢劫罪与盗窃罪的分布情况相似度很高,其热点区域也集中在市中心的下城区及后湾区。故意伤害案件中,除了下城区与后湾区是犯罪高发地区外,还有多切斯特地区(Dorchester)。

四、基于犯罪空间理论的结论

1.夏季为波士顿市犯罪高发期,故意伤害案件、抢劫案件、盗窃案件、故意损坏财物类案件都为夏季的主要犯罪类型,基于“日”维度来看,在夜晚时分发生上述案件的可能性更大。
2.ArcGIS可视化结果显示,城市中心下城区是波士顿市最主要的犯罪热点区域,下面基于犯罪理性选择理论来对这一点进行解释。犯罪理性选择理论强调潜在犯罪人会在犯罪前倾向于选择最有利、最能满足自己需求的行为模式,他们会仔细评估分析“在何时犯罪”、“何地犯罪”、“对哪些人犯何种罪”等诸如此类的问题。结果显示,在财产类犯罪中,城市中心下城区聚集的商业中心能够满足犯罪人对犯罪收益的期望;在人身伤害类犯罪中,下城区频繁的人口流动和较大的人口密度,又给潜在犯罪人提供了易于犯罪的社会环境,因此城市中心成为了各类犯罪分子实施犯罪的首选地。
3.多切斯特区是波士顿重要犯罪集中区,该地区适用社会失序理论。社会失序理论是指居民因受到人口不稳定性、种族混杂导致的文化异质性以及低收入或低社会地位等社会失序因素的影响,而容易产生犯罪行为。上文基于社会因素、阶级构成因素、经济发展因素对多切斯特地区高犯罪特征进行了多维度阐释,与社会失序理论十分契合。

一个小白关于波士顿犯罪数据集的分析就到这里啦~
波士顿犯罪数据时空分析及可视化文章来源地址https://www.toymoban.com/news/detail-499407.html

到了这里,关于波士顿犯罪数据时空分析及可视化的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python-机器学习-波士顿房价回归分析

            以波士顿房价数据集为对象,理解数据和认识数据,掌握 梯度下降法 和 回归分析 的初步方法,掌握 模型正则化 的一般方法,对回归分析的结果解读。         波士顿房价数据集是20世纪70年代中期波士顿郊区房价的中位数,统计了当时城市的13个指标与房价

    2024年02月06日
    浏览(34)
  • 波士顿房价数据集怎么不见了?

     做线性回归的同学大概率会用到一个数据集,即波士顿房价数据集,然而当你从sklearn下载该数据集时,你会惊讶地发现居然下载不了了!!!起初我以为是什么别的原因导致数据集可能被收回了,结果当我看到一篇文章就感觉,算了不做评价,参见这篇文章 消失的波士顿

    2024年02月05日
    浏览(69)
  • Excel数据可视化—波士顿矩阵图【四象限图】

      Excel系列文章是本人亲身经历职场之后萌发的想法,为什么Excel覆盖如此之广,几乎每个公司、学校、家庭都在使用,但是它深藏的宝藏功能却很少被人使用,PQ、BI这些功能同样适用于数据分析;并且在一些需要简单及时的数据分析项目前,Excel是完胜python、R、SPSS这些科

    2024年02月04日
    浏览(47)
  • 机器学习基础10-审查回归算法(基于波士顿房价的数据集)

    上一节介绍了如何审查分类算法,并介绍了六种不同的分类算法,还 用同一个数据集按照相同的方式对它们做了审查,本章将用相同的方式对回归算法进行审查。 在本节将学到: 如何审查机器学习的回归算法。 如何审查四种线性分类算法。 如何审查三种非线性分类算法。

    2024年02月11日
    浏览(39)
  • 机器学习之利用线性回归预测波士顿房价和可视化分析影响房价因素实战(python实现 附源码 超详细)

    数据集和源码请点赞关注收藏后评论区留下QQ邮箱或者私信 线性回归是利用最小二乘函数对一个或多个因变量之间关系进行建模的一种回归分析,这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个变量的称为一元回归,大于一个变量的情况叫做多元回归。

    2024年01月21日
    浏览(51)
  • 多元线性回归的python代码实现(基于sklearn的波士顿房价boston数据集为例)

    基于sklearn自带数据集波士顿房价数据集进行多元线性回归算法代码实现,其数据集包括13个特征向量,共计506个样本集。 本文代码实现步骤如下: 1. 获取数据集 2. 数据集切分,老规矩,80%训练,20%测试 3. 数据预处理(本用例尝试过归一化处理,但发现效果不好,不是每一个

    2024年02月06日
    浏览(51)
  • 机器学习---使用 TensorFlow 构建神经网络模型预测波士顿房价和鸢尾花数据集分类

    1. 预测波士顿房价 1.1 导包 最后一行设置了TensorFlow日志的详细程度: tf.logging.DEBUG :最详细的日志级别,用于记录调试信息。 tf.logging.INFO :用于记录一般的信息性消息,比如训练过程中的指标和进度。 tf.logging.WARN :用于记录警告消息,表示可能存在潜在问题,但不会导致

    2024年02月08日
    浏览(47)
  • python 波士顿房价预测

    数据集地址:Index of /ml/machine-learning-databases/housing (uci.edu) 数据集中共有506条样本数据,每条样本包含了13个影响房价的特征。 数据集格式 np.fromfile()  读取数据没有数据类型和数据的形状。所以这里使用了data.reshape()重新变换成原始的形状。 (7084,) (506, 14) (14,) [6.320e-03 1.800e+

    2023年04月08日
    浏览(40)
  • 波士顿矩阵(明星,金牛,问题,搜狗)

    波士顿矩阵(明星,金牛,问题,搜狗) 1、百度百科链接: https://baike.baidu.com/item/%E6%B3%A2%E5%A3%AB%E9%A1%BF%E7%9F%A9%E9%98%B5/5406040?fr=aladdin 2、从【产品】的维度去分析波士顿矩阵: https://zhidao.baidu.com/question/142432618995983965.html     2.1、明星产品(stars)。【高增长,高占有】      

    2024年02月05日
    浏览(31)
  • paddle实现波士顿房价预测任务

    要点: 参考官方案例 飞桨PaddlePaddle-源于产业实践的开源深度学习平台 1 加载飞桨框架的相关类库 飞桨支持两种深度学习建模编写方式,更方便调试的动态图模式和性能更好并便于部署的静态图模式。 动态图模式(命令式编程范式,类比Python):解析式的执行方式。用户无

    2023年04月14日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包