MySQL实战项目:淘宝母婴购物数据可视化分析

这篇具有很好参考价值的文章主要介绍了MySQL实战项目:淘宝母婴购物数据可视化分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

文章目录

前言

一、数据获取

1.母婴信息表:tianchi_mum_baby.csv

2.购物行为表: tianchi_mum_baby_trade_history.csv

二、数据预处理:

 1.修改数据类型

2.检查重复数据:

3.检查空格

4.去异常

三.数据分析

1.流量分析

2.类别分析

3.性别分析

总结


前言

母婴用品是淘宝的热门购物类目,随着国家鼓励二胎、三胎政策的推进,会进一步促进了母婴类目商品的销量。与此年轻一代父母的育儿观念也发生了较大的变化,因此中国母婴电商市场发展形态也越来越多样化。随之引起各大母婴品牌更加激烈的争夺,越来越多的母婴品牌管窥到行业潜在的商机,纷纷加入母婴电商,行业竞争越来越激烈。本项目会基于"淘宝母婴购物"数据集进行可视化分析。

一、数据获取

本数据集分析案例来自天池“淘宝母婴购物行为”数据集:淘宝母婴购物数据集_数据集-阿里云天池 ,并根据实际分析需要删除和重命名部分字段。包含两张数据集表:

1.母婴信息表:tianchi_mum_baby.csv

包括如下字段:

字段 字段说明 提取说明
user_id 用户标识 抽样和字段脱敏
birthday 出身日期 YYYYMMDD,精确到天
gender 性别 0:男孩,1:女孩,2:性别不明

部分数据预览:

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

2.购物行为表: tianchi_mum_baby_trade_history.csv

包括如下字段:

字段 字段说明 提取说明
user_id 用户标识 抽样和字段脱敏
auction_id 交易ID 字段脱敏
category_1 商品一级类目 字段脱敏
category_2 商品二级类目 字段脱敏
buy_mount 购买数量
day 交易时间 YYYYMMDD,精确到天

部分数据预览:

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

二、数据预处理:

 1.修改数据类型

可以观察到日期均为int类型,为了后续方便,修改为date类型

  ALTER TABLE tianchi_mum_babyuser
  MODIFY birthday DATE;

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

ALTER TABLE tianchi_mum_baby_trade_history
  MODIFY `day` DATE;

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

2.检查重复数据:

SELECT user_id,COUNT(*)  FROM tianchi_mum_babyuser
GROUP BY user_id
HAVING COUNT(*)>1;
                 

 查询结果为空,未发现重复项。

SELECT user_id ,auction_id,COUNT(*) FROM tianchi_mum_baby_trade_history
GROUP BY 
     user_id,
     auction_id    
HAVING 
     COUNT(*)>1;

查询结果为空,未发现重复项。

3.检查空格

  SELECT * FROM tianchi_mum_babyuser WHERE user_id IS NULL;
  SELECT * FROM tianchi_mum_babyuser WHERE birthday IS NULL;
  SELECT * FROM tianchi_mum_babyuser WHERE gender IS NULL;
  
  SELECT * FROM tianchi_mum_baby_trade_history WHERE user_id IS NULL;
  SELECT * FROM tianchi_mum_baby_trade_history WHERE auction_id IS NULL;
  SELECT * FROM tianchi_mum_baby_trade_history WHERE category_2 IS NULL;
  SELECT * FROM tianchi_mum_baby_trade_history WHERE category_1 IS NULL;
  SELECT * FROM tianchi_mum_baby_trade_history WHERE buy_mount IS NULL;
  SELECT * FROM tianchi_mum_baby_trade_history WHERE `day` IS NULL;

查询结果为空,未发现空值

4.去异常

  • 查询最大最小日期,删除这个范围以外的日期
  SELECT MAX(`day`),MIN(`day`) FROM tianchi_mum_baby_trade_history;

查询结果:最大日期2015-02-05,最小日期2012-07-02

  • 删除异常数据
  DELETE FROM tianchi_mum_baby_trade_history
  WHERE `day` < '2012-07-02'
  OR `day` > '2015-02-05';
  • 为了方便分析,过滤掉性别未知的数据

DELETE FROM  tianchi_mum_babyuser
WHERE gender = 2;

三.数据分析

1.流量分析

年/季度/月/日的商品销量如何?有什么规律

  • 年销量
  SELECT COUNT(buy_mount),DATE_FORMAT(DAY,'%Y')  FROM 
           tianchi_mum_baby_trade_history
  GROUP BY 
           DATE_FORMAT(DAY,'%Y')
  ORDER BY
           DATE_FORMAT(DAY,'%Y');

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

在数据预处理章节我们得知,本次抽样数据跨度为2012/07到2015/02,2013、2014为两个完整的年份,趋势应该是逐年递增的

  • 季度销量
  SELECT COUNT(buy_mount),SUBSTR(`day`,1,4) ,QUARTER(DAY)  FROM 
           tianchi_mum_baby_trade_history
  GROUP BY 
           SUBSTR(`day`,1,4) ,
           QUARTER(DAY)
  ORDER BY
           SUBSTR(`day`,1,4) ,
           QUARTER(DAY);

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

以2013、2014两个完整年为例,一般规律是Q1为全年销量最低的年份、Q4是全年销量最高的年份,猜想一个可能的原因是Q1因为春节假期导致的销量下滑,Q4是因为有双十一、双十二营销活动带来的增长。我们可以再按月分析来验证我们的结论:

  •  月销量
 SELECT  DATE_FORMAT(`day`, '%Y-%m' ) ,COUNT( buy_mount)  FROM
          tianchi_mum_baby_trade_history
 GROUP BY 
          DATE_FORMAT( `day`, '%Y-%m' ) 
 ORDER BY 
          DATE_FORMAT( `day`, '%Y-%m' );

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

还是以2013、2014年为例,2013年2月份、2014年1月份为全年销量最低,通过万年历查询我们知道这两个月份刚好位当年的春节所在的月份,11月份分别为两年的销售高峰。初步印证了我们关于春节和双十一营销活动对销量带来影响的猜想。 我们可以更进一步,以天为单位来观察销量数据:

  • 日销量
SELECT  DATE_FORMAT( `day`, '%Y-%m-%d' ) ,COUNT(buy_mount) FROM 
    tianchi_mum_baby_trade_history
GROUP BY 
    DATE_FORMAT( `day`, '%Y-%m-%d' ) 
ORDER BY 
    DATE_FORMAT( `day`, '%Y-%m-%d' );

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

可以看到,相比其他日期,双11购物节当天的销量出现了顶峰。 完成年/季度/月/日的销量分析后,我们再来看看商品类目的销售情况。

2.类别分析

商品销量按照类目分类有什么规律?哪些类目的商品更有价值?

本次抽样数据共包含6个商品大类(一级类目),662个商品二级类目。因本次抽样数据样本量较小,因此我们主要分析商品一级类目。 我们先来看看商品一级类目的销售情况:

1.category_1购买人数

SELECT COUNT(category_1), category_1 FROM
tianchi_mum_baby_trade_history
GROUP BY category_1

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

从购买频次上,最受用户喜欢的前三类商品分别是50008168、28、50014815;

 2.category_1销量

SELECT category_1,SUM(buy_mount)  FROM
tianchi_mum_baby_trade_history
GROUP BY
      category_1

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

以商品销量视角来看,最受大客户喜欢的前三类商品分别是28、50014815、50008168。

无论是从商品的购买频次还是商品销量上来看,商品一级分类可划分为两个梯度:畅销用品(50008168、28、50014815)及 一般用品(38、50022520、122650008),因此下一阶段主要针对畅销用品销量进行分析。

针对以上现象,平台或许可以将三类畅销商品展示在母婴用品相关购物主页上,以减轻用户购买负担,进一步提升畅销品销量。

3.性别分析

不同性别的婴幼儿购买行为相似吗?是否符合我们的常识呢?

根据用户的宝宝性别和各种类商品的销量情况,分析不同性别宝宝的购买偏好。

  • 婴儿性别与用户购买频次关系
SELECT COUNT(gender) FROM tianchi_mum_babyuser
WHERE gender = 0;

SELECT COUNT(gender) FROM tianchi_mum_babyuser
WHERE gender = 1;

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

  • 婴儿性别与用户购买量的关系
SELECT  b.gender , SUM(buy_mount) FROM 
tianchi_mum_babyuser b JOIN tianchi_mum_baby_trade_history t ON b.user_id = t.user_id
GROUP BY
       b.gender;

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

 我们再来统计性别在商品大类销售中的体现,看看能看到什么规律:

  •  男孩的类别销量统计:

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

  • 女孩的类别销量统计:
SELECT t.category_1 ,SUM(buy_mount) ,b.gender FROM 
tianchi_mum_babyuser b JOIN tianchi_mum_baby_trade_history t ON b.user_id = t.user_id
WHERE b.gender=1
GROUP BY
       t.category_1

MySQL实战项目:淘宝母婴购物数据可视化分析,mysql,数据库,sql,数据分析

从上面图表中可以看出,一级类别28、50008168和50014815三种类别销量最高,且在各年份中这三类商品的销量一直较高,所以可以大力推广宣传和供应这三类商品。男性宝宝和女性宝宝都比较偏爱于50008168类商品,可以重点将这类商品推荐给用户。


总结

本项目对淘宝母婴购物数据集做了初步的数据分析,通过数据分析我们能对业务做出更好的洞察。使用了mysql查询,以及excel制图功能,完成了流量分析、类别分析和用户画像分析的实验。文章来源地址https://www.toymoban.com/news/detail-759367.html

到了这里,关于MySQL实战项目:淘宝母婴购物数据可视化分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于python淘宝商品数据爬虫分析可视化系统 网络爬虫+Flask框架+MySQL数据库 大数据 毕业设计

    python语言、Flask框架、淘宝商品数据、selenium网络爬虫、MySQL数据库、数据分析、Echarts可视化大数据毕业设计、爬取 Selenium网络爬虫淘宝商品数据可视化系统是一个基于Python和Selenium的Web爬虫应用程序,可以实现对淘宝上特定商品的价格、销量、评价等数据进行自动化抓

    2024年02月16日
    浏览(42)
  • 数据可视化实战【mysql+pyecharts+web】

    用到的工具:Navicat(数据库软件)Navicat | 支持 MySQL、MariaDB、MongoDB、SQL Server、SQLite、Oracle 和 PostgreSQL 的数据库管理,IDLE(python),jupyter notebook,pyecharts 1.安装mysql数据库,cmd输入命令mysql -V 查看mysql是否安装成功。  成功会显示mysql版本,若不成功输入pip install mysql 进行安

    2024年02月04日
    浏览(30)
  • 数据可视化-ECharts Html项目实战(5)

     在之前的文章中,我们学习了如何设置滚动图例,工具箱设置和插入图片。想了解的朋友可以查看这篇文章。同时,希望我的文章能帮助到你,如果觉得我的文章写的不错,请留下你宝贵的点赞,谢谢 数据可视化-ECharts Html项目实战(4)-CSDN博客 https://blog.csdn.net/qq_49513817/

    2024年03月24日
    浏览(37)
  • Python数据可视化实战期末课程设计——各科目考试成绩可视化项目

    大家访问这个即可下载数据集和源代码!!! gitee项目源码及数据文件在这里,点击 1、训练要点 (1)掌握使用seaborn库或者matplotlib库进行数据可视化的方法 (2)掌握撰写可视化分析报告的方法 2、需求说明 在现实生活中,学生的成绩与表现往往受制于多方面的因素。在教学研

    2024年02月06日
    浏览(32)
  • 基于Python的淘宝行为数据可视化分析

    完成如下商业分析任务,通过数据分析和可视化展示,充分挖掘数据的价值,让数据更好地为业务服务: 流量分析 :PV/UV是多少,通过分析PV/UV能发现什么规律? 漏斗分析 :用户“浏览-收藏-加购-购买”的转化率是怎样的? 用户价值分析 :对电商平台什么样的用户是有价值

    2024年02月10日
    浏览(38)
  • Python淘宝手机数据可视化分析大屏全屏系统

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,学习后应对毕业设计答辩。 项目配有对应开发文档、

    2024年04月14日
    浏览(42)
  • 数据分析案例-顾客购物数据可视化分析

      🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 1.项目背景 2.数据集介绍 3.技术工具 4.导入数据 5.数据可视化 5.1分析性别比例 5.2年龄

    2024年02月07日
    浏览(41)
  • Python爬虫淘宝手机数据可视化分析大屏全屏系统

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,免费 项目配有对应开发文档、开题报告、任务书、

    2024年02月03日
    浏览(37)
  • Python淘宝手机爬虫数据可视化分析大屏全屏系统

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,学习后应对毕业设计答辩。 项目配有对应开发文档、

    2024年04月17日
    浏览(32)
  • 基于python商品数据采集分析可视化系统 淘宝数据采集 大数据 大屏可视化(附源码+论文)大数据毕业设计✅

    毕业设计:2023-2024年计算机专业毕业设计选题汇总(建议收藏) 毕业设计:2023-2024年最新最全计算机专业毕设选题推荐汇总 🍅 感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业 。

    2024年02月02日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包