使用Python对物流行业数据进行数据分析

这篇具有很好参考价值的文章主要介绍了使用Python对物流行业数据进行数据分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


Excel适合处理低量级数据,当数据量过高,Excel只能展现部分数据,不利于后续的数据分析,此时使用Python进行数据分析更加方便,有效。

一、数据清洗

先使用info()函数查看数据信息

data=pd.read_csv('data_wuliu.csv',encoding='gbk')
data.info()

使用Python对物流行业数据进行数据分析
从图中可以看出该物流数据共有1160条数据,每条数据有10列,其中订单号货品交货状况数量列存在缺失值,同时销售金额的类型是object类型,应转换其数据类型。具体操作如下:

1. 重复值、缺失值、格式调整

删除重复记录

data.drop_duplicates(keep='first',inplace=True)

使用Python对物流行业数据进行数据分析

删除缺失值

data.dropna(axis=0,how='any',inplace=True)

使用Python对物流行业数据进行数据分析

删除订单列

考虑到订单列对分析数据无关紧要,将订单列删除

data.drop(columns=['订单行'],inplace=True,axis=1)

使用Python对物流行业数据进行数据分析

更新索引

data.reset_index(drop=True,inplace=True)

使用Python对物流行业数据进行数据分析

清洗数据

使用Python对物流行业数据进行数据分析
从图中可以看出,销售金额中含有 “,”,空格,且单位不一致,对此,编写自定义过滤函数,将逗号和空格删除,并统一单位

def data_deal(number):
    if number.find('万元') !=-1: # 找到带有万元的
        number_new=float(number[:number.find('万元')].replace(',',''))*10000
    else:
        number_new=float(number.replace('元','').replace(',',''))
    return number_new

data['销售金额']=data['销售金额'].map(data_deal)

使用Python对物流行业数据进行数据分析

2. 异常值处理

使用Python对物流行业数据进行数据分析
从上图可以看出,存在销售金额为0的情况,为异常值,将其删除,同时该数据的中位数远小于平均数,即销售金额和数量存在严重右偏现象,属于正常现象,无需处理。删除代码如下:

data=data[data['销售金额']!=0]

二、数据规整

增加一项辅助列:月份

data['销售时间']=pd.to_datetime(data['销售时间'])
data['月份']=data['销售时间'].apply(lambda x:x.month)

使用Python对物流行业数据进行数据分析

三、 数据分析

1. 配送服务是否存在问题

从三个维度展开分析,具体分析如下:

① 月份维度

data['货品交货状况']=data['货品交货状况'].str.strip() 
data1=data.groupby(['月份','货品交货状况']).size().unstack() 
data1['按时交货率']=data1['按时交货']/(data1['按时交货']+data1['晚交货'])

使用Python对物流行业数据进行数据分析
结论:从按时交货率来看,第四季度低于第三季度,猜测气候原因可能会影响配送

② 销售区域维度

data2=data.groupby(['销售区域','货品交货状况']).size().unstack() 
data2['按时交货率']=data2['按时交货']/(data2['按时交货']+data2['晚交货'])

使用Python对物流行业数据进行数据分析
结论:西北地区存在突出的延时交货问题,急需解决

③ 货品维度

data3=data.groupby(['货品','货品交货状况']).size().unstack() 
data3['按时交货率']=data3['按时交货']/(data3['按时交货']+data3['晚交货'])

使用Python对物流行业数据进行数据分析

结论:货品4晚交货情况非常严重,其余货品交货情况较好

④ 货品和销售区域结合

data4=data.groupby(['货品','销售区域','货品交货状况']).size().unstack() 
data4['按时交货率']=data4['按时交货']/(data4['按时交货']+data4['晚交货'])

使用Python对物流行业数据进行数据分析

结论:货品4送往西北地区的晚交货情况严重,货品2送往马来西亚晚交货情况非常严重

2. 是否存在尚有潜力的销售区域

① 月份维度

data5=data.groupby(['月份','货品'])['数量'].sum().unstack()
data5.plot(kind='line')
plt.show()

使用Python对物流行业数据进行数据分析
结论:货品2在10月份和12月份销量猛增,原因猜测:公司加大营销力度或者开发了新的市场

② 销售区域维度

data6=data.groupby(['销售区域','货品'])['数量'].sum().unstack()

使用Python对物流行业数据进行数据分析

结论:从销售区域看,每种货品销售区域为1-3个,货品1有三个销售区域,货品2有两个销售区域,其余货品均有一个销售区域

③ 月份和销售区域

data7=data.groupby(['月份','销售区域','货品'])['数量'].sum().unstack()

使用Python对物流行业数据进行数据分析
使用Python对物流行业数据进行数据分析
结论:货品2在10、12月份销量猛增,原因主要发生在原有销售区域;货品2在7、8、9、11月份销售数量还有很大提升空间,可以适当加大营销力度;货品2在8月份在两个销售区域的销量均有提升,在马来西亚地区的涨幅更大,可以尝试继续在马来西亚增大营销力度

3.商品是否存在质量问题

data['货品用户反馈']=data['货品用户反馈'].str.strip()
data8=data.groupby(['货品','销售区域'])['货品用户反馈'].value_counts().unstack()
data8['合格率']=data8['质量合格']/data8.sum(axis=1)
data8['返修率']=data8['返修']/data8.sum(axis=1)
data8['拒货率']=data8['拒货']/data8.sum(axis=1)

使用Python对物流行业数据进行数据分析
结论:货品3、6、5合格率均较高,返修率比较低,说明质量还可以;货品1、2、4合格率较低,返修率较高,质量存在一定问题,需要改善,建议扩大抽检范围,增大质检力度;货品2在马来西亚的拒货率最高,同时在马来西亚的按时交货率也非常低,猜测:马来西亚人对送货的时效性要求较高,如果没有按时到货,往往考虑退货,建议加快运输;虑到货品2主要在华东地区销量大,可以考虑增大在华东的投资,适当减少马来西亚的投入文章来源地址https://www.toymoban.com/news/detail-499081.html

四、总结

  1. 货品4—>西北,货品2—>马来西亚两条路线存在较大问题,急需提升时效
  2. 货品2在华东地区还有较大市场空间,适合加大投入,同时货品2在马来西亚配送时效长,用户拒收率高,从成本角度考虑,应该减少投入
  3. 货品1、2、4质量存在问题,建议扩大抽检范围,增大质检力度

到了这里,关于使用Python对物流行业数据进行数据分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 面向物流行业的文档管理系统

    物流和货运行业的效率激烈战在公路、火车、货船和空中展开。DocuWare 的快速、安全和灵活的文档管理是真正的竞争优势。在您的公司和客户的核心流程中节省新的成本和时间。 智能链接货运单据和发票 在国际物流领域,监控流程和为客户开具发票所需的文件可能被卡在卡

    2023年04月08日
    浏览(36)
  • 极智嘉x吉利汽车 x京东物流,引领汽车行业智慧物流新变革!

    近日,中国领先的汽车制造商吉利汽车携手中国领先的技术驱动的供应链解决方案及物流服务商京东物流、全球仓储机器人引领者极智嘉(Geek+),在西安吉利汽车制造基地RDC仓库率先落地SkyPick上存下拣解决方案,实现了全物流链精益化、智能化、一体化管理,创造了汽车行业

    2024年02月11日
    浏览(33)
  • 区块链如何应用于物流行业:提高透明度,降低成本

    作者:禅与计算机程序设计艺术 随着移动互联网、云计算、大数据、物联网等新兴技术的出现以及产业的快速发展,信息化建设已经进入了一个全新的阶段,并将面临着巨大的变革性挑战。基于此背景,区块链技术应运而生,作为一种高效率、低成本、安全可靠的信息传输工

    2024年02月12日
    浏览(44)
  • 极智嘉(Geek+)再获重磅荣誉,持续力领跑智慧物流行业发展

    近日,全球仓储机器人引领者极智嘉(Geek+)再度传来好消息,凭借着全球化的专业服务能力和稳健增长的亮眼海外成绩,一举荣登“2023出海品牌服务商”价值榜,成为唯一登榜的物流机器人企业。 作为率先出海的物流机器人企业,极智嘉(Geek+)在全球化发展和服务方面颇有建树

    2024年02月11日
    浏览(30)
  • ChatGPT在物流与运输行业的智能场景:智能调度和自动驾驶的前瞻应用

      第一章:引言 随着人工智能技术的飞速发展,物流与运输行业正迎来一场革命。传统的调度和运输模式已经无法满足快速增长的物流需求和客户期望。在这一领域,ChatGPT作为一种先进的自然语言处理模型,具有巨大的潜力。本文将探讨ChatGPT在物流与运输行业中智能调度和

    2024年02月10日
    浏览(40)
  • 如何使用Python进行数据分析?

    要使用Python进行数据分析,可以按照以下步骤进行: 安装Python:首先,你需要安装Python解释器。可以从Python官方网站下载并安装适合你操作系统的Python版本。 安装数据分析库:Python有许多强大的数据分析库,如NumPy、Pandas和Matplotlib。使用pip命令或包管理工具安装这些库。 导

    2024年02月10日
    浏览(57)
  • 使用Python批量进行数据分析

    知识延伸 1、sort_value()是pandas模块中DataFrame对象的函数,用于将数据区域按照某个字段的数据进行排序,这个字段可以是行字段,也可以是列字段。 语法格式: sort_value(by=\\\'##\\\',axis=0,ascending=True,inplace=False,na_position=\\\'last\\\') 参数 说明 by 要排序的列名或索引值 axis 如果省略或者为

    2024年02月10日
    浏览(39)
  • 使用Python进行数据分析——方差分析

    大家好,方差分析可以用来判断几组观察到的数据或者处理的结果是否存在显著差异。本文介绍的方差分析(Analysis of Variance,简称ANOVA)就是用于检验两组或者两组以上样本的均值是否具备显著性差异的一种数理统计方法。 根据影响试验条件的因素个数可以将方差分析分为

    2024年02月15日
    浏览(65)
  • Python小知识 - 使用Python进行数据分析

    使用Python进行数据分析 数据分析简介 数据分析,又称为信息分析,是指对数据进行综合处理、归纳提炼、概括总结的过程,是数据处理的第一步。 数据分析的目的是了解数据的内在规律,为数据挖掘,并应用于商业决策、科学研究等提供决策依据。 数据分析的基本方法 数

    2024年02月10日
    浏览(31)
  • 使用Python进行健身手表数据分析

    健身手表(Fitness Watch)数据分析涉及分析健身可穿戴设备或智能手表收集的数据,以深入了解用户的健康和活动模式。这些设备可以跟踪所走的步数、消耗的能量、步行速度等指标。本文将带您完成使用Python进行Fitness Watch数据分析的任务。 Fitness Watch数据分析是健康和保健领域

    2024年02月10日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包