拍拍贷数据分析-逾期情况分析

这篇具有很好参考价值的文章主要介绍了拍拍贷数据分析-逾期情况分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

数据背景
所提供数据来自拍拍贷真实业务数据,从2015-01-01到2017-01-30的所有信用标的10%sample样本。数据集包含LC.csv(标的特征表数据)和LP.csv(标的还款计划和还款记录表)数据。详情如下:
数据字典
1.LC.csv 数据大小:50.7MB
LC (Loan Characteristics) 表为标的特征表,每支标一条记录。共有21个字段,包括一个主键(listingid)、7个标的特征和13个成交当时的借款人信息,全部为成交当时可以获得的信息。
逾期数据分析,python,数据分析,python逾期数据分析,python,数据分析,python
逾期数据分析,python,数据分析,python
2.LP.csv 数据大小:198MB
LP (Loan Periodic) 表为标的还款计划和还款记录表,每支标每期还款为一条记录。 还款记录和状态更新至2017年2月22日。共有10个字段,包括两个主键(listingid和期数),3个还款计划字段和4个还款状态字段
字段序号 字段名 字段注释
逾期数据分析,python,数据分析,python

数据预览
1.LC.csv
逾期数据分析,python,数据分析,python
LP.csv
逾期数据分析,python,数据分析,python

  1. 计算整体逾期情况
  2. 月逾期人数、金额
  3. 不同年龄、性别、初试信用评级的逾期情况
  4. 影响逾期率因素分析

1计算整体逾期情况

逾期率 = 逾期期数/(正常还款期数+逾期还款期数)

    //逾期还款次数/(yuqi_times+normal_times) 0.081
    df_all_counts.agg(functions
      .sum("yuqi_times")/
      (functions.sum("yuqi_times")+
        functions.sum("normal_times")))

2月逾期用户、金额

逾期数据分析,python,数据分析,python
逾期数据分析,python,数据分析,python
随着时间的增加,逾期人数未归还金额越来越多,平台风险增大。

3不同年龄、性别、初试信用评级等的逾期情况

年龄

逾期数据分析,python,数据分析,python
25岁以下借款人逾期率普遍高于整体逾期率,30-40岁借款人逾期率最低。

性别

逾期数据分析,python,数据分析,python
女性逾期率略高于男性。

认证个数

逾期数据分析,python,数据分析,python
认证个数大于3个的逾期率较低,小于三个逾期率较高。

初始信用评级

逾期数据分析,python,数据分析,python
初始信用评级越高,逾期率越低。

贷款类型

逾期数据分析,python,数据分析,python
普通贷款类型逾期率最高。

贷款金额

逾期数据分析,python,数据分析,python
贷款金额低于1万元时逾期率较低。

根据逾期情况提出运营建议

平台随着时间增加,逾期人数和金额都在增加,平台风险变大。根据各类型的逾期情况改变贷款策略。年龄低于25岁、认证个数小于三个、初试信用等级低于D和贷款金额较大的用户都应谨慎放贷。文章来源地址https://www.toymoban.com/news/detail-822172.html

到了这里,关于拍拍贷数据分析-逾期情况分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Python数据分析】数据分析之numpy基础

    实验环境:建立在Python3的基础之上 numpy提供了一种数据类型,提供了数据分析的运算基础,安装方式 导入numpy到python项目 本文以案例的方式展示numpy的基本语法,没有介绍语法的细枝末节,笔者认为通过查阅案例就能掌握基本用法。 numpy数组的基本概念 numpy默认所有元素具有

    2024年02月10日
    浏览(47)
  • python毕设选题 - 大数据商城人流数据分析与可视化 - python 大数据分析

    🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天

    2024年02月19日
    浏览(56)
  • 数据分析实战-Python实现博客评论数据的情感分析

    现在很多网站、小程序、应用软件、博客、电商购物平台等,都有很多的用户评论数据,这些数据包含了用户对产品的认知、看法和一些立场; 那么我们可以对这些数据进行情感分析,可以得到一些有价值的信息,帮助我们进一步提升产品价值或用户体验; 本文主要针对某

    2024年03月13日
    浏览(64)
  • Python数据分析—基于机器学习的UCI心脏病数据分析(源码+数据+分析设计)

    下载链接:https://pan.baidu.com/s/1ys2F6ZH4EgnFdVP2mkTcsA?pwd=LCFZ 提取码:LCFZ 心脏病是一类比较常见的循环系统疾病。循环系统由心脏、血管和调节血液循环的神经体液组织构成,循环系统疾病也称为心血管病,包括上述所有组织器官的疾病,在内科疾病中属于常见病,其中以心脏病

    2024年02月07日
    浏览(57)
  • 使用Python进行数据分析——方差分析

    大家好,方差分析可以用来判断几组观察到的数据或者处理的结果是否存在显著差异。本文介绍的方差分析(Analysis of Variance,简称ANOVA)就是用于检验两组或者两组以上样本的均值是否具备显著性差异的一种数理统计方法。 根据影响试验条件的因素个数可以将方差分析分为

    2024年02月15日
    浏览(72)
  • 【Python数据分析实战】豆瓣读书分析(含代码和数据集)

    @[TOC]豆瓣 数据集: 链接:douban.csv 提取码:pmls 从数据集中可以发现出版时间的数据格式多样,有1999,2012/12,1923-4,2019年六月,因此需要提取出其年份 结果: False 46173 True 7 Name: 页数, dtype: int64 结果: False 42813 True 2073 Name: 书名, dtype: int64

    2023年04月09日
    浏览(38)
  • [数据分析大全]基于Python的数据分析大全——Numpy基础

    NumPy 的全称为 Numeric Python,它是 Python 的第三方扩展包,主要用来计算、处理一维或多维数组。   步入8月了,7月时因为项目所需,自学了 深度学习 相关的内容,现在 已经把项目所需要的神经网络框架搭建起来了,输入输出也都归一化了,模拟误差也加上了,图像的参数

    2024年02月14日
    浏览(65)
  • 毕设 B站数据分析与可视化 - python 数据分析 大数据

    🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天

    2024年02月10日
    浏览(50)
  • 【100天精通Python】Day53:Python 数据分析_NumPy数据操作和分析进阶

    目录 1. 广播  2 文件输入和输出 3 随机数生成 4 线性代数操作  5 进阶操作

    2024年02月09日
    浏览(67)
  • 大数据爬虫分析基于Python+Django旅游大数据分析系统

    欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。    基于Python和Django的旅游大数据分析系统是一种使用Python编程语言和Django框架开发的系统,用于处理和分析旅游行业的大数据,为旅游从业者和决策者提供有关旅游趋势、客户需求、市场竞争

    2024年02月03日
    浏览(65)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包