星巴克门店分布可视化分析
项目介绍:使用python对星巴克门店分布进行可视化分析
数据背景:数据源来自与Kaggle: Starbucks Locations Worldwide | Kaggle,囊括了截至2017/2月份全球星巴克门店的基础信息,包括品牌名称、门牌地址、所在国家、经纬度等一系列详细的信息。
数据介绍:
字段名称 | 解释说明 |
---|---|
Brand | 品牌名称 |
Store Number | 门店编号 |
Store name | 门店名称 |
Ownership Type | 门店所有权类型 |
Street Address | State/Province |
City | 门店所在的城市 |
State/Province | 门店所在的省份 |
Country | 门店所在的国家 |
Postcode | 门店所在地址的邮政编码 |
Phone Number | 门店的联系电话 |
Timezone | 门店所在地的时区 |
Longitude | 门店地址的经度 |
Latitude | 门店地址的纬度 |
centered 文本居中 | right-aligned 文本居右 |
任务概述
- 星巴克旗下有多少个品牌
- 统计全球有多少个国家开设了星巴克门店,显示排名前五和后十的国家
- 显示拥有星巴克门店数量前十的城市
- 按照星巴克在中国的分布情况,统计排名前十的城市
- 用饼图显示星巴克的经营方式有几种
导入必要的数据包
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
读取数据并查看
data = pd.read_csv(r'./Desktop/directory.csv.csv')
data.head()
查看缺失值
data.isnull().sum()
利用isnull()函数对数据进行缺失值统计,可以发现每一列数据的缺失情况,在此数据中city、postcode、phone number字段存在较多缺失值,但本次任务处理的指标与其相关不大,故不对其进行处理文章来源:https://www.toymoban.com/news/detail-448757.html
统计星巴克旗下有多少品牌
num = len(data['Brand'].unique())
print('星巴克旗下有%d个品牌'%num)
data['Brand'].value_counts()
利用unique()函数对”Brand‘字段进去去重处理,得到星巴克旗下的品牌数量,再利用value_counts函数对每一个品牌的门店数量进行统计,发现星巴克旗下一共有4个品牌,其中Starbucks文章来源地址https://www.toymoban.com/news/detail-448757.html
到了这里,关于数据分析实战——星巴克门店数量可视化分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!