Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

这篇具有很好参考价值的文章主要介绍了Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

下面对一组关于全球星巴克门店的统计数据,分析了在不同国家和地区以及中国不同城市的星巴克门店的数量

1:导入模块

import pandas as pd
import numpy as np
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
%matplotlib inline

2:获取数据 并打印前五行

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

starbucks = pd.read_csv("data//directory.csv")
starbucks.head()

 3:数据分析及可视化

首先查看星巴克旗下有哪些品牌,如果我们只关心星巴克咖啡门店,则只需要获取星巴克中Brand的数据集,并查看全世界一共有多少家星巴克门门店

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

# 星巴克旗下有哪些品牌?
print("星巴克旗下品牌有:\n",starbucks.Brand.value_counts())
# 把重心放在星巴克的咖啡门店上面,所以只查看Brand是Starbucks的数据集内容。
coffee = starbucks[starbucks.Brand=='Starbucks']
# 全世界一共有多少家星巴克门店?
print("-------------------------")
print(coffee.shape)

 然后查看全世界一共有多少个国家和地区开设了星巴克门店,显示门店数量排名前十和后十的国家和地区

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

 Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

df = starbucks.groupby(["Country"]).size()
print("全世界一共多少个国家开设了星巴克门店:",df.size)
df1 = df.sort_values( ascending=False)
print("排名前10的国家:\n",df1.head(10))
# 星巴克门店数排名后10的国家
# df2 = df.sort_values()
# df2.head(10)
print("排名后10的国家:\n",df1.tail(10))

 然后用柱状图可视化绘制排名前十的分布情况

可见美国和中国是比较多的

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

plt.rcParams['font.size'] = 15
plt.rcParams['font.family'] = 'SimHei'
# # 拥有星巴克门店最多的国家是哪里?
# plt.figure(1,figsize=(8,6))
# count_starbucks =coffee.Country.value_counts()
# count_top10 = count_starbucks.head(10)
# print(count_top10)
# count_top10.plot(kind='bar',rot=0)
df1.head(10).plot(kind='bar',rot=0)
plt.title('星巴克门店数排名前10的国家')
plt.ylabel('Store Counts')
plt.xlabel('Countries')

还有排名后十的国家

 Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

# plt.figure(1,figsize=(8,6))
# count_starbucks =coffee.Country.value_counts()
# count_last10 = count_starbucks.tail(10)
# print(count_last10)
df1.tail(10).plot(kind='bar',rot=0)
plt.title('星巴克门店数排名后10的国家')
plt.ylabel('Store Counts')
plt.xlabel('Countries')

 接着显示拥有星巴克门店数量排名前十的城市

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

可见上海是最多的城市

star = starbucks.dropna(how='any',subset=['City'])
star.isnull().sum()
count_starbucks_city = star.City.value_counts()
print("全世界星巴克门店数量排名前10的城市:\n",count_starbucks_city.head(10))

 绘制星巴克门店数量前十的城市分布柱状图

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

plt.figure(1,figsize=(8,6))
count_starbucks_city =star.City.value_counts()
city_top10 = count_starbucks_city.head(10)
city_top10.plot(kind='bar',rot=30)
plt.title('拥有星巴克门店最多的10个城市')
plt.ylabel('Store Counts')
plt.xlabel('Cities')

 可以看到数据不是很规范,城市名称既有中文又有英文,而且上海被存储为ShangHai和Shanghai。 对于上海的问题,我们将拼音全部改为小写即可; 对于中文和拼音混用的问题,可以使用相应的python库(如库pinyin)将中文转换为拼音后作统计

按照星巴克门店在中国的分布情况,统计排名前十的城市

这里使用到了DataFrame.apply(func)方法,该方法将函数func应用到整个DataFrame上, 也可以通过指定axis参数来指定每一行或每一列的数据应用函数func。

接下来使用reset_index方法将上一步得到的数据封装到一个新的DataFrame中排序即可

 

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

import pinyin
#选择中国的数据
df = star[star["Country"]=="CN"]

df1 = df.copy()
#将城市名改为小写
df1["City"] = df1["City"].apply(lambda x:x.lower())
# df1.shape
# df2 = df1.copy()
#将汉字城市名改为小写拼音
df1["City"] = df1["City"].apply(lambda x:pinyin.get(x, format="strip", delimiter="")[0:-3]) #去掉“市”的拼音
#统计每个城市的星巴克数量
df1 = df1.groupby(["City"]).size().sort_values( ascending=False)
df1.head(10)

 绘制前十名柱状图

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

plt.figure(1,figsize=(8,6))
df1.head(10).plot(kind='bar',rot=30)
plt.title('中国拥有星巴克门店最多的10个城市')
plt.ylabel('Store Counts')
plt.xlabel('Cities')

 最后用饼状图显示星巴克门店的经营方式有哪几种

Company Owned:公司独资直营,这也是星巴克门店最多的经营方式

Licensed: 许可经营

Joint Venture: 合资经营,比如:国内江浙沪地区的星巴克最早就是由星巴克与统一集团联手经营

Franchise:授权经营,类似麦当劳的经营模式

 

Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)

 

plt.figure(1,figsize=(8,6))
ownership = star['Ownership Type'].value_counts()
plt.title('星巴克门店所有权类型')
ownership.plot(kind='pie')

创作不易 觉得有帮助请点赞关注收藏~~~文章来源地址https://www.toymoban.com/news/detail-462918.html

到了这里,关于Python统计全球星巴克门店的数据及在不同国家和地区门店数量可视化(超详细 附源码)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python语法-数据可视化(全球GDP动态柱状图开发)

    python数据可视化(全球GDP动态柱状图开发) 开发工具:pycharm、pyecharts模块 (项目数据见文末参考内容) 效果图如下(轮播1960-2019年的柱状图): 参考内容: 项目数据(https://mp.csdn.net/mp_download/manage/download/UpDetailed) python语法-pyecharts 黑马程序员-python基础

    2024年02月08日
    浏览(54)
  • 门店销售数据分析

    本文以优衣库门店销售数据为例,利用数据分析工作经验及业务理解对门店销售数据进行数据分析展示。 结论先行-数据分析报告结论: 1.用户更加偏向于在周末的时间段内进行消费,周末的日平均销售指标是工作日的平均指标的1.7倍,各门店可以选择在周末的时间段内增加

    2024年02月06日
    浏览(43)
  • 用Python做数据分析之数据统计

    接下来说说数据统计部分,这里主要介绍数据采样,标准差,协方差和相关系数的使用方法。 1、数据采样 Excel 的数据分析功能中提供了数据抽样的功能,如下图所示。Python 通过 sample 函数完成数据采样。 2、数据抽样 Sample 是进行数据采样的函数,设置 n 的数量就可以了。函

    2024年02月07日
    浏览(51)
  • Python实战:通过微信小程序,获取Manner Coffee全国门店信息

    有公众号读者在后台提问,想要上海 manner 门店信息。 首先常规思路,先去 manner 官网找数据入口,发现只有门店的名称,没有其他信息,字段比较单薄。 其次,官网的门店数据没有及时更新,一些新开的店没有录入。 换个思路,去 MannerCoffee 点单小程序找一下数据,小程序

    2024年02月20日
    浏览(71)
  • Python 机器学习入门:数据集、数据类型和统计学

    机器学习是通过研究数据和统计信息使计算机学习的过程。机器学习是迈向人工智能(AI)的一步。机器学习是一个分析数据并学会预测结果的程序。 在计算机的思维中,数据集是任何数据的集合。它可以是从数组到完整数据库的任何东西。 数组的示例: [99,86,87,88,111,86,10

    2024年02月05日
    浏览(46)
  • Python学习——数据分组统计、分组运算及透视

    分割 split : 按照键值(key)或者分组变量将数据分组 应用 apply : 对每个组应用函数, 通常是累计,转换或过滤函数 组合 combine : 将每一组的结果合并成一个输出组 常用功能 新增加一列 年龄ew 将填充后的年龄补充上去 数据聚合(agg):一般指的是能够从数组产生的标量值的数

    2024年02月10日
    浏览(47)
  • python DataFrame数据分组统计groupby()函数

    df = pd.DataFrame(data=data, index=index, columns=columns) print(df) print(“=================================================”) df1 = df.groupby([‘class_1’, ‘class_2’]).sum() # 分组统计求和 print(df1) 1.3 对DataFrameGroupBy对象列名索引(对指定列统计计算) 其中,df.groupby(‘class_1’)得到一个DataFrameGroupBy对象,

    2024年04月25日
    浏览(34)
  • Python数据可视化(三)绘制统计图形大全

    以 Python 代码的形式讲解柱状图的绘制原理,这里重点讲解 bar()函数的使用方法。 代码: 运行结果: 为了展示图表里的中文字体,我们选择字体“SimHei”, 通 过 “mpl.rcParams[\\\"font.sans-serif\\\"] =[\\\"SimHei\\\"]”完成字体配置任务。不使用默认的“Unicode minus”模式来处理坐标轴轴线的刻

    2024年02月02日
    浏览(47)
  • 星巴克推出Web3平台;天啦噜,AI绘画能007了;『决策算法』电子书;合成人脸数据集;面向数据的版本控制;前沿论文 | ShowMeAI资讯日报

    👀 日报合辑 | 📆 电子月刊 | 🔔 公众号下载资料 | 🍩 @韩信子 https://stories.starbucks.com/press/2022/starbucks-brewing-revolutionary-web3-experience-for-its-starbucks-rewards-members/ 9 月 12 日星巴克宣布推出 Web3 平台 Starbucks Odyssey,将星巴克的忠诚度计划 Starbucks Rewards 与 NFT 平台相结合,允许客户

    2024年02月08日
    浏览(49)
  • python数据分析-概率论与数理统计基础

    大家好,今天我们用python语言去实现概率论与数理统计的一些基础计算等。常用第三方SciPy库、NumPy库来实现概率论和数理统计的计算。 SciPy是一个基于Python的开源库,是一组专门解决科学计算中各种基本问题的模块的集合,经常与NumPy、StatsModels、SymPy这些库一起使用。SciPy的

    2024年02月07日
    浏览(58)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包