Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）-Toy模板网

这篇具有很好参考价值的文章主要介绍了Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

下面对一组关于全球星巴克门店的统计数据，分析了在不同国家和地区以及中国不同城市的星巴克门店的数量

1：导入模块

import pandas as pd
import numpy as np
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
%matplotlib inline

2：获取数据并打印前五行

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

starbucks = pd.read_csv("data//directory.csv")
starbucks.head()

3：数据分析及可视化

首先查看星巴克旗下有哪些品牌，如果我们只关心星巴克咖啡门店，则只需要获取星巴克中Brand的数据集，并查看全世界一共有多少家星巴克门门店

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

# 星巴克旗下有哪些品牌？
print("星巴克旗下品牌有：\n",starbucks.Brand.value_counts())
# 把重心放在星巴克的咖啡门店上面，所以只查看Brand是Starbucks的数据集内容。
coffee = starbucks[starbucks.Brand=='Starbucks']
# 全世界一共有多少家星巴克门店？
print("-------------------------")
print(coffee.shape)

然后查看全世界一共有多少个国家和地区开设了星巴克门店，显示门店数量排名前十和后十的国家和地区

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

df = starbucks.groupby(["Country"]).size()
print("全世界一共多少个国家开设了星巴克门店:",df.size)
df1 = df.sort_values( ascending=False)
print("排名前10的国家：\n",df1.head(10))
# 星巴克门店数排名后10的国家
# df2 = df.sort_values()
# df2.head(10)
print("排名后10的国家：\n",df1.tail(10))

然后用柱状图可视化绘制排名前十的分布情况

可见美国和中国是比较多的

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

plt.rcParams['font.size'] = 15
plt.rcParams['font.family'] = 'SimHei'
# # 拥有星巴克门店最多的国家是哪里？
# plt.figure(1,figsize=(8,6))
# count_starbucks =coffee.Country.value_counts()
# count_top10 = count_starbucks.head(10)
# print(count_top10)
# count_top10.plot(kind='bar',rot=0)
df1.head(10).plot(kind='bar',rot=0)
plt.title('星巴克门店数排名前10的国家')
plt.ylabel('Store Counts')
plt.xlabel('Countries')

还有排名后十的国家

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

# plt.figure(1,figsize=(8,6))
# count_starbucks =coffee.Country.value_counts()
# count_last10 = count_starbucks.tail(10)
# print(count_last10)
df1.tail(10).plot(kind='bar',rot=0)
plt.title('星巴克门店数排名后10的国家')
plt.ylabel('Store Counts')
plt.xlabel('Countries')

接着显示拥有星巴克门店数量排名前十的城市

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

可见上海是最多的城市

star = starbucks.dropna(how='any',subset=['City'])
star.isnull().sum()
count_starbucks_city = star.City.value_counts()
print("全世界星巴克门店数量排名前10的城市：\n",count_starbucks_city.head(10))

绘制星巴克门店数量前十的城市分布柱状图

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

plt.figure(1,figsize=(8,6))
count_starbucks_city =star.City.value_counts()
city_top10 = count_starbucks_city.head(10)
city_top10.plot(kind='bar',rot=30)
plt.title('拥有星巴克门店最多的10个城市')
plt.ylabel('Store Counts')
plt.xlabel('Cities')

可以看到数据不是很规范，城市名称既有中文又有英文，而且上海被存储为ShangHai和Shanghai。对于上海的问题，我们将拼音全部改为小写即可；对于中文和拼音混用的问题，可以使用相应的python库（如库pinyin）将中文转换为拼音后作统计

按照星巴克门店在中国的分布情况，统计排名前十的城市

这里使用到了DataFrame.apply(func)方法，该方法将函数func应用到整个DataFrame上，也可以通过指定axis参数来指定每一行或每一列的数据应用函数func。

接下来使用reset_index方法将上一步得到的数据封装到一个新的DataFrame中排序即可

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

import pinyin
#选择中国的数据
df = star[star["Country"]=="CN"]

df1 = df.copy()
#将城市名改为小写
df1["City"] = df1["City"].apply(lambda x:x.lower())
# df1.shape
# df2 = df1.copy()
#将汉字城市名改为小写拼音
df1["City"] = df1["City"].apply(lambda x:pinyin.get(x, format="strip", delimiter="")[0:-3]) #去掉“市”的拼音
#统计每个城市的星巴克数量
df1 = df1.groupby(["City"]).size().sort_values( ascending=False)
df1.head(10)

绘制前十名柱状图

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

plt.figure(1,figsize=(8,6))
df1.head(10).plot(kind='bar',rot=30)
plt.title('中国拥有星巴克门店最多的10个城市')
plt.ylabel('Store Counts')
plt.xlabel('Cities')

最后用饼状图显示星巴克门店的经营方式有哪几种

Company Owned：公司独资直营，这也是星巴克门店最多的经营方式

Licensed: 许可经营

Joint Venture: 合资经营，比如：国内江浙沪地区的星巴克最早就是由星巴克与统一集团联手经营

Franchise：授权经营，类似麦当劳的经营模式

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

plt.figure(1,figsize=(8,6))
ownership = star['Ownership Type'].value_counts()
plt.title('星巴克门店所有权类型')
ownership.plot(kind='pie')

创作不易觉得有帮助请点赞关注收藏~~~文章来源地址https://www.toymoban.com/news/detail-462918.html

到了这里，关于Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

1：导入模块

2：获取数据并打印前五行

3：数据分析及可视化

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细 附源码）

1：导入模块

2：获取数据 并打印前五行

3：数据分析及可视化

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化（超详细附源码）

2：获取数据并打印前五行