【python plotly库介绍】从视觉到洞见:桑基图在业务分析中的应用【保姆级教程过于详细珍藏版】

这篇具有很好参考价值的文章主要介绍了【python plotly库介绍】从视觉到洞见:桑基图在业务分析中的应用【保姆级教程过于详细珍藏版】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

 👤作者介绍:10年大厂数据\经营分析经验,现任大厂数据部门负责人。
会一些的技术:数据分析、算法、SQL、大数据相关、python

欢迎加入社区:码上找工作
作者专栏每日更新:

LeetCode解锁1000题: 打怪升级之旅
python数据分析可视化:企业实战案例
备注说明:方便大家阅读,统一使用python,带必要注释,公众号 数据分析螺丝钉 一起打怪升级

桑基图(Sankey Diagram)是一种特殊类型的流图,以流的宽度来表示数据量的大小,广泛应用于展示能量、材料、成本或其他信息的流动和转化。它能直观地显示多个过程或阶段之间的关系,以及在这些过程中量的分配或转换情况。介绍桑基图之前我们先介绍一下这次主要用到的库plotly

plotly库介绍

plotly是一个非常强大的Python图形库,它支持创建丰富的交互式图表和数据可视化。作为一个开源库,plotly允许用户以简单的Python代码生成复杂的图形,如线图、散点图、柱状图、饼图、热力图、3D图和桑基图等。由于其交互性强,plotly生成的图表可以让用户通过鼠标操作(如点击、拖拽、缩放等)来探索数据,这使得plotly在数据分析和科学研究中尤为受欢迎。

核心特点

  1. 交互性plotly图表具有高度的交互性,用户可以直接在图表上进行操作,如悬停显示详细信息、缩放、更新数据等。

  2. 多平台支持plotly可以在Jupyter Notebook中直接使用,同时支持将图表导出为HTML文件,便于在网页中嵌入和分享。

  3. 丰富的图表类型plotly支持广泛的图表类型,能够覆盖绝大多数的数据可视化需求。

  4. 高度可定制:几乎图表中的每个元素都是可定制的,包括颜色、大小、布局等,满足个性化的展示需求。

  5. 与Dash结合plotly是构建Dash应用的核心库之一,Dash是一个用于构建数据驱动的Web应用的框架,利用plotly进行数据可视化。

基本用法

安装plotly

pip install plotly

创建一个简单的散点图:

import plotly.graph_objects as go

# 创建散点图
fig = go.Figure(data=go.Scatter(x=[1, 2, 3, 4], y=[10, 11, 12, 13], mode='markers'))

# 显示图表
fig.show()

创建桑基图:

import plotly.graph_objects as go

fig = go.Figure(go.Sankey(
    node=dict(
        pad=15,
        thickness=20,
        line=dict(color="black", width=0.5),
        label=["Node 1", "Node 2", "Node 3"],
    ),
    link=dict(
        source=[0, 1],  # 定义源节点
        target=[2, 2],  # 定义目标节点
        value=[8, 4],  # 定义流量值
    )))

fig.update_layout(title_text="简单桑基图示例")
fig.show()

高级用法

动画

plotly支持为图表添加动画效果,这对于展示随时间变化的数据特别有用。例如,可以创建一个动画来展示股票价格的变化或者气候变化的模拟。

import plotly.graph_objects as go
from plotly.subplots import make_subplots

# 创建带有动画的散点图
fig = make_subplots(rows=1, cols=1)

# 添加初始数据
fig.add_trace(go.Scatter(x=[1, 2, 3, 4], y=[10, 11, 12, 13], mode="markers"), row=1, col=1)

# 添加动画帧
fig.add_trace(go.Scatter(x=[1, 2, 3, 4], y=[13, 11, 12, 10], mode="markers"), row=1, col=1)

fig.update_layout(updatemenus=[dict(type="buttons",
                                     buttons=[dict(label="Play",
                                                   method="animate",
                                                   args=[None])])])

# 定义动画
fig.update(frames=[go.Frame(data=[go.Scatter(x=[1, 2, 3, 4], y=[11, 12, 13, 14])]),
                    go.Frame(data=[go.Scatter(x=[1, 2, 3, 4], y=[14, 13, 12, 11])])])

fig.show()

展示-点击前

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

展示-点击后

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

子图布局

plotly允许在一个图表中创建多个子图(subplot),这在需要同时展示多个相关数据集时非常有用。

from plotly.subplots import make_subplots
import plotly.graph_objects as go

# 创建包含2行1列子图的图表
fig = make_subplots(rows=2, cols=1)

# 添加第一个子图:折线图
fig.add_trace(go.Scatter(x=[1, 2, 3], y=[4, 5, 6]), row=1, col=1)

# 添加第二个子图:柱状图
fig.add_trace(go.Bar(x=[1, 2, 3], y=[3, 2, 1]), row=2, col=1)

fig.show()

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

样式定制

plotly提供了广泛的样式定制选项,包括颜色、字体、图例、布局等,使得图表完全符合你的品牌或个人偏好。

import plotly.graph_objects as go

fig = go.Figure(data=go.Bar(x=['A', 'B', 'C'], y=[20, 14, 23]))
fig.update_layout(title_text='自定义样式示例',
                  title_font_size=20,
                  xaxis=dict(title='X轴标题'),
                  yaxis=dict(title='Y轴标题'),
                  paper_bgcolor='lightgray',
                  plot_bgcolor='lightblue')
fig.show()

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

与Dash集成创建交互式Web应用

plotly是Dash框架的核心,Dash允许开发者用纯Python构建丰富的交互式Web应用。这使得plotly不仅限于静态的数据可视化,还可以用于开发复杂的分析工具和仪表盘。

# 需要安装dash库
from dash import Dash, dcc, html
import plotly.graph_objects as go

app = Dash(__name__)

fig = go.Figure(data=go.Bar(y=[1, 3, 2]))
graph = dcc.Graph(figure=fig)

app.layout = html.Div(children=[html.H1(children='Hello Dash'),
                                html.Div(children='Dash: Web Dashboards with Python.'),
                                graph])

if __name__ == '__main__':
    app.run_server(debug=True)

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

企业场景

  1. 能源流动:展示能源从来源到最终用途的转化和分布,如电力或热能的生产、传输和消耗过程。

  2. 成本流分析:在生产和服务过程中,通过桑基图可以直观地显示不同成本因素(原材料、人工、运输等)如何组成总成本。

  3. 物料与资源流:用于展示在生产系统中物料的流动路径和损耗情况,帮助优化资源利用效率。

  4. 网站用户行为:分析用户在网站或应用中的行为路径,如页面访问流程、购物车添加到购买的转化流程等。

  5. 供应链与物流:显示产品从原材料采购、生产加工到最终销售的全过程中的物流和信息流。

使用方法

桑基图的制作涉及以下几个关键步骤:

  1. 确定节点:定义图中的所有节点,每个节点代表流程中的一个状态或阶段。

  2. 定义流:确定节点之间的流动关系,包括流的来源和去向。

  3. 量化数据:为每条流分配一个量值,量值的大小将决定图中流的宽度。

  4. 选择工具:根据需求选择合适的工具绘制桑基图。常用的工具包括Python的matplotlibplotly库,以及在线制图工具如SankeyMATIC或Google Charts等。

  5. 自定义样式:根据展示需求调整桑基图的颜色、标签、布局等,使图表更加直观易懂。

案例分析-城市在一年内的能源消耗流动

背景

假设我们需要分析一个城市在一年内的能源消耗流动情况。这个城市主要的能源来源包括:太阳能、风能、煤炭和天然气。这些能源被用于发电、供暖和汽车燃料。目标是直观展示各种能源来源到最终用途的流动路径及其量值,从而评估城市能源利用的效率和可持续性

数据

展示了能源流动的来源、目标和量值:

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

数据可视化

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

通过桑基图,我们可以直观地看到城市能源消耗的全貌,包括各种能源来源对发电、供暖和汽车燃料的贡献比例。从图中可以发现,煤炭是主要的能源来源,尤其在发电和供暖方面的贡献最大,但这也可能意味着较高的碳排放。太阳能和风能虽然对发电有所贡献,但总量相对较小,表明可再生能源的利用率有待提高

python代码

import plotly.graph_objects as go
# 定义节点:能源来源 + 使用目的
labels = ["太阳能", "风能", "煤炭", "天然气", "发电", "供暖", "汽车燃料"]
# 定义流:源节点、目标节点、流量值
source = [0, 1, 2, 3, 3, 2, 2, 3]  # 能源来源节点索引
target = [4, 4, 4, 4, 5, 5, 6, 6]  # 使用目的节点索引
value = [120, 180, 500, 200, 150, 350, 50, 30]  # 流量值(千兆瓦时)
# 创建桑基图
fig = go.Figure(data=[go.Sankey(
    node=dict(
      pad=15,  # 节点间距
      thickness=20,  # 节点厚度
      line=dict(color="black", width=0.5),
      label=labels,
    ),
    link=dict(
      source=source,  # 源节点索引列表
      target=target,  # 目标节点索引列表
      value=value,  # 流量值列表
    ))])
fig.update_layout(title_text="城市能源消耗流动分析", font_size=10)
fig.show()

案例分析-企业成本分析

场景

一家大型企业希望通过深入分析其一年内的成本构成来识别成本节约的机会。该企业的成本主要包括原材料成本、劳动力成本、制造成本、销售与市场推广成本以及其他运营成本。通过构建一个桑基图,企业能够直观地理解不同成本部分如何贡献到总成本中,并识别可能的成本优化领域。

数据

以下是该企业一年内不同成本部分的数据(单位:百万美元):

cost_data = {
    '总成本': 1000,
    '原材料成本': 300,
    '劳动力成本': 200,
    '制造成本': 250,
    '销售与市场推广成本': 150,
    '其他运营成本': 100
}

数据可视化

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

原材料成本和劳动力成本是主要的直接成本:这两项成本直接流向制造成本,表明它们是生产过程中最重要的成本组成部分。这反映了在制造行业中,原材料采购和人力资源管理对于成本控制的重要性。

制造成本占总成本的一大块:制造成本不仅包括原材料和劳动力,还可能包含其他间接成本,如设备折旧、能源消耗等。这提示管理层需要关注生产效率和生产过程中的成本优化

import plotly.graph_objects as go
​
# 定义桑基图的节点标签
labels = ["总成本", "原材料成本", "劳动力成本", "制造成本", "销售与市场推广成本", "其他运营成本"]
​
# 定义桑基图的流
source = [1, 2, 3, 3, 3, 3]  # 流的源节点索引
target = [3, 3, 0, 4, 5, 0]  # 流的目标节点索引
value = [300, 200, 250, 150, 100, 500]  # 流的数值
customdata = ["300百万美元", "200百万美元", "250百万美元", "150百万美元", "100百万美元", "500百万美元"] # 自定义数据
​
# 创建桑基图
fig = go.Figure(data=[go.Sankey(
    node=dict(
      pad=15,
      thickness=20,
      line=dict(color="black", width=0.5),
      label=labels,
    ),
    link=dict(
      source=source,  # 源节点索引列表
      target=target,  # 目标节点索引列表
      value=value,  # 流的数值
      customdata=customdata,  # 流的自定义数据
      hovertemplate='%{customdata}<extra></extra>'  # 设置鼠标悬停时显示的文本模板
    ))])
​
fig.update_layout(title_text="年度企业成本分析桑基图", font_size=10)
fig.show()

案例分析-电子商务网站用户行为

场景

一个电子商务网站希望分析其用户的行为路径,从访问首页开始,到浏览产品、添加到购物车、进行结算,最后到完成购买的整个流程。目的是为了了解在哪些步骤中用户最可能流失,以便采取措施优化用户体验和提高转化率。

数据

以下是一个简化的示例数据,描述了用户在不同步骤中的数量:

  • 首页访问: 10000 用户

  • 浏览产品: 5000 用户

  • 添加到购物车: 2500 用户

  • 进行结算: 1250 用户

  • 完成购买: 600 用户

数据可视化

直接在桑基图流上或节点旁静态显示转化率在plotly中并不直接支持,因此以下示例采用了一种间接的方式,即在图表的标题中包含转化率信息会更直观一些

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

基于网站用户行为路径的桑基图分析,其中展示了从“首页访问”到“完成购买”的整个过程,以及各个步骤的转化率,我们可以得出以下结论:

显著的转化漏斗:数据明显展示了一个典型的转化漏斗模型,用户数量从首页访问到最终购买逐步减少。这种模式在电子商务网站中很常见,但关键在于识别和优化转化路径中的关键节点,以最大化转化率。

关键流失点:在从“添加到购物车”到“进行结算”的过程中,转化率出现了明显下降。这提示我们这一环节可能是用户流失的关键点,需要进一步分析原因(如是否购物车页面的用户体验存在问题,结算流程是否过于复杂等),并采取相应的优化措施。

简化购买流程:由于在结算环节存在较大的流失,简化购买和结算流程可能有助于提高转化率。这可能包括减少结算步骤、优化移动端体验、提供更多支付选项等。增强用户参与度:在浏览产品阶段增加用户的参与和互动(如通过推荐系统、限时优惠等),可能有助于提高用户从浏览到添加购物车的转化率。

python代码

import plotly.graph_objects as go
​
# 桑基图的数据
labels = ["首页访问", "浏览产品", "添加到购物车", "进行结算", "完成购买"]
source = [0, 1, 2, 3]
target = [1, 2, 3, 4]
value = [5000, 2500, 1250, 600]
​
# 计算转化率
conversion_rates = [f"{value[i]/value[i-1]*100:.2f}%" for i in range(1, len(value))]
conversion_rates.insert(0, "100%")  # 假设第一个转化率为100%
​
# 构建标题,包含转化率信息
title_text = "网站用户行为路径分析<br><sup>转化率: 首页访问到浏览产品: {}, 浏览产品到添加到购物车: {}, " \
             "添加到购物车到进行结算: {}, 进行结算到完成购买: {}</sup>".format(*conversion_rates)
​
fig = go.Figure(data=[go.Sankey(
    node=dict(
        pad=15,
        thickness=20,
        line=dict(color="black", width=0.5),
        label=labels,
    ),
    link=dict(
        source=source, 
        target=target, 
        value=value, 
    ))])
​
fig.update_layout(title_text=title_text, font_size=10)
fig.show()

案例分析-全球智能手机供应链与物流分析

场景

一个全球智能手机品牌想要分析其供应链和物流网络,以便更好地理解从原材料采购、组件制造、组装,到最终产品分销的整个流程。该品牌的供应链涉及多个国家,包括原材料的采购(如稀有金属来自澳大利亚和刚果),组件的制造(如处理器来自台湾,屏幕来自韩国),在中国组装,最后产品销售遍及全球。通过构建一个桑基图,公司希望能够直观地展示这一复杂网络中的主要流动路径和量级。

数据

以下是简化的示例数据:

  • 原材料:澳大利亚(稀有金属)、刚果(钴)

  • 组件制造:台湾(处理器)、韩国(屏幕)

  • 组装:中国

  • 销售:美国、欧洲、印度、其他地区

假设的产品流量(单位:万台):

  • 澳大利亚到中国:500

  • 刚果到中国:500

  • 台湾到中国:1000

  • 韩国到中国:1000

  • 中国到美国:500

  • 中国到欧洲:400

  • 中国到印度:300

  • 中国到其他地区:300

数据可视化

plotly 桑基图,python数据分析可视化,python,数据分析,数据可视化,产品运营,matplotlib,plotly,开发语言

分析结论

供应链全球化:智能手机供应链的全球化特征非常明显,原材料和关键组件的供应跨越多个国家和地区,显示了对全球资源的依赖和利用。

中国的制造中心角色:中国作为智能手机的主要组装地,再次凸显了其在全球制造业中的中心地位,利用其成熟的供应链和物流体系。

主要市场分布:智能手机的主要销售市场集中在美国、欧洲和印度,这些地区的销售量占据了大部分,但也有相当一部分分布在其他地区,表明智能手机市场的广泛性和多样性。

优化建议

多元化供应链:鉴于供应链的全球化和对特定地区的依赖,企业应考虑多元化其供应链,以减少地缘政治风险、自然灾害或贸易政策变化带来的影响。

提高供应链的透明度和可追溯性:增加供应链的透明度,确保原材料的可持续采购和道德生产,这不仅能提高品牌形象,还能减少潜在的供应风险。

优化物流和库存管理:利用先进的数据分析和预测模型,优化库存水平和物流效率,减少运输成本,提高响应市场变化的能力。

增强本地市场的销售策略:针对主要销售市场以外的“其他地区”,探索更多本地化的销售和营销策略,以挖掘新的增长点。

提升供应链的灵活性和韧性:构建一个更加灵活和韧性的供应链体系,能够快速适应市场需求的变化,应对突发事件,保证供应链的连续性和效率。文章来源地址https://www.toymoban.com/news/detail-854104.html

python代码

import plotly.graph_objects as go
​
# 定义桑基图节点
labels = [
    "澳大利亚", "刚果", "台湾", "韩国", 
    "中国", "美国", "欧洲", "印度", "其他地区"
]
​
# 定义流的源和目的
source = [0, 1, 2, 3, 4, 4, 4, 4]
target = [4, 4, 4, 4, 5, 6, 7, 8]
value = [500, 500, 1000, 1000, 500, 400, 300, 300]
​
# 创建桑基图
fig = go.Figure(data=[go.Sankey(
    node=dict(
      pad=15,
      thickness=20,
      line=dict(color="black", width=0.5),
      label=labels,
    ),
    link=dict(
      source=source,
      target=target,
      value=value,
    ))])
​
# 更新图表的布局和标题,包括主要数据
title_text = """
全球智能手机供应链与物流分析<br>
<sup>原材料和组件: 澳大利亚(500万台), 刚果(500万台), 台湾(1000万台), 韩国(1000万台)<br>
组装地点: 中国; 主要销售市场: 美国(500万台), 欧洲(400万台), 印度(300万台), 其他地区(300万台)</sup>
"""
​
fig.update_layout(title_text=title_text, font_size=10)
fig.show()

到了这里,关于【python plotly库介绍】从视觉到洞见:桑基图在业务分析中的应用【保姆级教程过于详细珍藏版】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • SPI扩展点在业务中的使用及原理分析

    SPI 全称Service Provider Interface。面向接口编程中,我们会根据不同的业务抽象出不同的接口,然后根据不同的业务实现建立不同规则的类,因此一个接口会实现多个实现类,在具体调用过程中,指定对应的实现类,当业务发生变化时会导致新增一个新的实现类,亦或是导致已经

    2024年02月05日
    浏览(36)
  • 简要介绍 | 计算机视觉中的开放词汇:挑战与未来

    注1:本文系“简要介绍”系列之一,仅从概念上对计算机视觉中的开放词汇(open vocabulary)进行非常简要的介绍,不适合用于深入和详细的了解。 注2:\\\"简要介绍\\\"系列的所有创作均使用了AIGC工具辅助 计算机视觉( Computer Vision )是一门研究如何使计算机能够 理解和解释 图像或视

    2024年02月10日
    浏览(55)
  • 矩阵分析与计算机视觉中的图像分类

    计算机视觉(Computer Vision)是一门研究如何让计算机理解和解释图像和视频的科学。图像分类(Image Classification)是计算机视觉中的一个重要任务,它涉及将图像分为不同类别的过程。矩阵分析(Matrix Analysis)是线性代数(Linear Algebra)的一个分支,它研究矩阵的性质、运算和应用。在计

    2024年02月20日
    浏览(38)
  • 特征向量与矩阵分析在计算机视觉中的应用

    计算机视觉(Computer Vision)是人工智能领域的一个重要分支,它旨在让计算机理解和处理人类视觉系统所能看到的图像和视频。计算机视觉的主要任务包括图像处理、特征提取、图像识别、目标检测和跟踪等。在这些任务中,特征向量和矩阵分析技术发挥着关键作用。 特征向

    2024年02月01日
    浏览(57)
  • 机器学习之计算机视觉中的深度学习:卷积神经网络介绍

    文章代码来源:《deep learning on keras》,非常好的一本书,大家如果英语好,推荐直接阅读该书,如果时间不够,可以看看此系列文章。 在这一章,我们会学习卷积神经网络,一种在计算机视觉中常用的深度学习模型,你将会学着将它们运用到分类问题中。 我们首先会介绍卷

    2024年02月04日
    浏览(67)
  • 视频监控业务平台羚通视频智能分析平台无人机统计人数算法在人数统计中的应用策略

    随着科技的飞速发展,视频监控业务平台在各个领域的应用越来越广泛。其中,羚通视频智能分析平台凭借其先进的人工智能技术,为监控视频的智能化分析和处理提供了强大的支持。在众多应用中,无人机统计人数算法在人数统计方面的表现尤为突出。本文将深入探讨视频

    2024年02月03日
    浏览(48)
  • 使用Yfinance和Plotly分析金融数据

    大家好,今天我们用Python分析金融数据,使用Yfinance和Plotly绘制图表,带你了解在Python中使用Plotly制作图表,利用Plotly强大的图表功能来分析和可视化金融数据。 导语 在本文中,我们将深入研究Plotly,从而高效绘制和分析金融数据。我们将探讨Plotly基础的图表功能,以及如何

    2024年02月13日
    浏览(47)
  • 超市零售数据可视化分析(Plotly 指南)

    CSDN 上不能插入 HTML,可以在 GitHub Page 上查看: https://paradiseeee.github.io/2022/07/30/超市零售数据可视化分析/ 项目首次发布于 Kesci 上 – 超市零售数据分析。感兴趣的可以直接上去 Fork 之后自己做。由于上面只能用 Jupyter Notebook,而且还没有权限 DIY 工作环境,于是线下重新做一

    2024年02月11日
    浏览(55)
  • 1. MATLAB的Plot中的Legend设定为多行多列

    在MATLAB R0219中(低版本可能不适用),您可以使用 legend 函数来设置图例的位置和布局。要将图例标记变成2行2列的形式,您可以使用 \\\'NumColumns\\\' 参数设置列数。以下是一个示例 在这个例子中, legend(\\\'NumColumns\\\', 2) 将图例标记设置为2行2列的形式。您可以根据需要调整数据和图例的

    2024年04月08日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包