使用HiveQL实现来实现,本数据为上牌汽车的销售数据,分为乘用车辆和商用车辆。数据包含销售相关数据与汽车具体参数。数据项包括:时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前后车轮、轮胎规格、轮胎数、载客数、所有权、购买人相关信息等。
3.1创建数据库works。
3.2创建外部表
(1)在hdfs上创建一个空目录work_car;
文章来源地址https://www.toymoban.com/news/detail-489086.html
(2)在hive中刚刚建立的数据库works下创建表CarData。
3.3导入数据
3.4查询前10条数据
文章来源:https://www.toymoban.com/news/detail-489086.html
4 需求分析(使结果前十用HiveQL实现):
4.1汽车行业市场分析:
1统计乘用车辆和商用车辆的数量(即非营运和营运车辆)
2统计山西省2013年每个月的汽车销售数量
4.2 用户数据市场分析:
1 统计买车的男女比例
4.3 不同车型销售统计分析:
1统计不同类型车在每年的总销售量
2 统计各品牌汽车销售量,按销售量倒序排序
3按所有权和类型分组统计销量
4.统计不同排量的车的数量(排量分为3级 小排量:1000以下,中排量:1000-3000,大排量3000及以上)
5 针对某一品牌的竞争分析:
1 统计五菱每一个月的销售量
6针对各市销售分析:
1.统计各市销售量,按销量倒序排序
到了这里,关于Hive数据分析案例——汽车销售数据分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!