kaggle—酒店预订需求预测分析

这篇具有很好参考价值的文章主要介绍了kaggle—酒店预订需求预测分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

kaggle—酒店预订需求预测分析(Hotel booking demand)

项目背景:该项目为酒店线上预订业务的研究内容,从酒店运营的角度,分析酒店的房型供给、不同时间段的需求,核心消费群体,影响退订的因素,并建立分类算法模型对酒店订单退订进行预测。

数据来源:kaggle:Hotel booking demand,此项目数据为kaggle上的一个Hotel booking数据集,感兴趣的朋友可以去下载进行练习。

数据介绍:

字段名 字段含义
hotel 酒店名
is_canceled 是否退订
lead_time 入住时间
arrival_date_year 入住的年份
arrival_date_month 入住的月份
arrival_date_week_number 一年中的第几周
arrival_date_day_of_month 一年中的第几号
stays_in_weekend_nights 周末过夜数
stays_in_week_nights 周中过夜数
adults 成人数
children 儿童数
babies 婴儿数
meal 订餐情况
country 国籍
market_segment 细分市场
distribution_channel 市场
is_repeated_guest 是否回头客
previous_cancellations 客户在预订前取消的预订数量
previous_bookings_not_canceled 客户在预订之前未取消的预订数量
reserved_room_type 房型
assigned_room_type 房间类型编码
booking_changes 对预订做出的更改数量
deposit_type 是否交押金
agent 旅行社id
company 公司
days_in_waiting_list 确认订单前的审核天数
customer_type 预订类型
adr 平均每日放假
required_car_parking_spaces 客户要求的车位数量
total_of_special_requests 特殊要求的数量
reservation_status 订单状态
reservation_status_date 订单状态的最后设置日期

一共包含32个字段,119390条记录。

项目流程

  • 数据预处理
    • 缺失值处理
    • 数据类型转换
    • 异常值处理
  • 特征工程
    • 数值型特征标准化
    • 类别型特征 one-hot编码
    • 特征选择
  • 模型训练
  • 模型预测与评估

一、数据预处理

  1. 导入需要的库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
import seaborn as sns
  1. 查看并理解数据
df = pd.read_csv('hotel_bookings.csv',encoding='gbk')
df.head()
df.info()
结果:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 119390 entries, 0 to 119389
Data columns (total 32 columns):
 #   Column                          Non-Null Count   Dtype  
---  ------                          --------------   -----  
 0   hotel                           119390 non-null  object 
 1   is_canceled                     119390 non-null  int64  
 2   lead_time                       119390 non-null  int64  
 3   arrival_date_year               119390 non-null  int64  
 4   arrival_date_month              119390 non-null  object 
 5   arrival_date_week_number        119390 non-null  int64  
 6   arrival_date_day_of_month       119390 non-null  int64  
 7   stays_in_weekend_nights         119390 non-null  int64  
 8   stays_in_week_nights            119390 non-null  int64  
 9   adults                          119390 non-null  int64  
 10  children                        119386 non-null  float64
 11  babies                          119390 non-null  int64  
 12  meal                            119390 non-null  object 
 13  country                         118902 non-null  object 
 14  market_segment                  119390 non-null  object 
 15  distribution_channel            119390 non-null  object 
 16  is_repeated_guest               119390 non-null  int64  
 17  previous_cancellations          119390 non-null  int64  
 18  previous_bookings_not_canceled  119390 non-null  int64  
 19  reserved_room_type              119390 non-null  object 
 20  assigned_room_type              119390 non-null  object 
 21  booking_changes                 119390 non-null  int64  
 22  deposit_type                    119390 non-null  object 
 23  agent                           103050 non-null  float64
 24  company                         6797 non-null    float64
 25  days_in_waiting_list            119390 non-null  int64  
 26  customer_type                   119390 non-null  object 
 27  adr                             119390 non-null  float64
 28  required_car_parking_spaces     119390 non-null  int64  
 29  total_of_special_requests       119390 non-null  int64  
 30  reservation_status              119390 non-null  object 
 31  reservation_status_date         119390 non-null  object 
dtypes: float64(4), int64(16), object(12)
memory usage: 29.1+ MB

发现数据集一共有32个字段,119389行数据,company列有比较明显缺失值,另外arrival_date等表示时间的列需要合并并且转换为日期格式。

  1. 日期合并及格式转换

由于数据集中的arrival_date_month月份信息为英文表示,先将其转换为中文月份表示,方便后期合并日期文章来源地址https://www.toymoban.com/news/detail-542293.html

#修改arrival_date_month的英文月份为中文月份
import calendar
month = []
for i in df.arrival_date_month:
    mon = list(calendar.month_name).index(i)
    month.append(mon)
df.insert(

到了这里,关于kaggle—酒店预订需求预测分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 酒店预订小程序源码 含前后端+搭建教程

    分享一个酒店预订在线订房小程序源码,程序包含前端+后端,详细的搭建教程。 系统特色功能一览: 1、在线订房,在线订餐,在线积分兑换商品,在线购买商品,分享分销功能,返利管理; 2、订阅消息邮件提醒,语音提醒,新增了微信消息提醒(访客在酒店小程序下单后,

    2024年02月12日
    浏览(31)
  • 民宿/酒店预订小程序管理系统设计与实现

    目的 :本课题主要目标是设计并能够实现一个基于微信小程序酒店预订系统,前台用户使用小程序,后台管理使用基PHP+MySql的B/S架构;通过后台添加房间,用户通过小程序登录,查看房间、选房间、填写信息、下单等。 意义 :微信小程序酒店预约系统是计算机技术与酒店管

    2024年02月11日
    浏览(44)
  • 微信小程序酒店宾馆民宿房间预订系统设计与实现

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,免费 项目配有对应开发文档、开题报告、任务书、

    2024年02月04日
    浏览(32)
  • SpringBoot+微信小程序实现的酒店预订小程序系统 附带详细运行指导视频

    项目演示地址: 视频地址 项目描述:这是一个 基于SpringBoot+微信小程序框架 开发的酒店预订小程序系统。首先,这是一个 前后端分离 的项目,代码简洁规范,注释说明详细,易于理解和学习。其次,这项目功能丰富,具有一个酒店预订小程序系统该有的所有功能。 项目功

    2024年04月22日
    浏览(23)
  • 【华为OD机试python】预订酒店【 2023 Q1 A卷|100分】

    ■ 题目描述 放暑假了,小明决定到某旅游景点游玩,他在网上搜索到了各种价位的酒店(长度为n的数组A), 他的心理价位是x元,请帮他筛选出k个最接近x元的酒店(n=k0),并由低到高打印酒店的价格。 输入描述 第一行:n, k, x 第二行:A[0] A[1] A[2]…A[n-1] 输出描述 从低到高

    2024年02月03日
    浏览(29)
  • 基于JAVA+Springboot+Thymeleaf前后端分离项目:酒店宾馆房间预订系统设计与实现

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,学习后应对毕业设计答辩。 项目配有对应开发文档、

    2024年02月21日
    浏览(30)
  • 【旅游度假】Axure酒店在线预订APP原型图 旅游度假子模块原型模板

    页面数量:共 20+ 页 兼容软件:Axure RP 9/10,不支持低版本 应用领域:旅游度假,生活服务 作品申明:页面内容仅用于功能演示,无实际功能 本作品为「酒店在线预订」的移动端原型设计图,主要功能包括:主页、搜索、酒店详情、在线预订、订单管理等模块与功能。 本作

    2024年02月12日
    浏览(29)
  • 基于微信小程序的民宿短租酒店预订系统设计与实现(源码+lw+部署文档+讲解等)

    💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 2023-2024年最值得选的微信小程序毕业设计

    2024年04月26日
    浏览(38)
  • 商业智能、数据分析和需求预测在现代零售管理中的关键运用

    文章来源:第七在线官方 现代零售面临着激烈的市场竞争和日益增长的消费者期望值。 无论是实体商铺、电子商务还是其它渠道,零售商都必须时刻掌握各类进销存数据,并结合对流行趋势和未来销售的预期做出最有效的经营决策 。这一切都对现代零售商在管理中如何高效

    2024年02月01日
    浏览(30)
  • 2022-2028年全球与中国半导体组装和测试服务(SATS)行业市场需求预测分析

    本文研究全球与中国市场半导体组装和测试服务(SATS)的发展现状及未来发展趋势,分别从生产和消费的角度分析半导体组装和测试服务(SATS)的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价

    2023年04月11日
    浏览(80)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包