金融风控建模常用指标介绍(WOE, IV, KS, PSI)

这篇具有很好参考价值的文章主要介绍了金融风控建模常用指标介绍(WOE, IV, KS, PSI)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

金融风控建模常用指标介绍(WOE, IV, KS, PSI)

近期在做金融风控相关项目,有必要把特征和模型的衡量指标总结下,以备不时之需。这次主要介绍4个指标(WOE, IV, KS, PSI)。

  • WOE(Weight of Evidence, 用于特征变换,衡量变量某个取值的预测能力)
    WOE算法已在我的另一篇文章数据预处理-分箱(Binning)和 WOE编码介绍过,这里不再赘述。

  • IV(Information Value, 衡量特征的预测能力)
    金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型其中,
    金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型
    IV值可以看作WOE值的加权求和,IV值的衡量标准可以参考:
    金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型

  • KS(Kolmogorov-Smirnov, 衡量模型对好坏样本的区分能力)

每个分箱中累计坏客户率减去累计好客户率的最大值。
金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型
举例:样本总量891,好客户549,坏客户342(见下标),表中数据计算方法。

  • 表中第一行:

    total_rate=90/891=10.1%,

    cum_good_rate=good_rate=2/549=0.36%,

    cum_bad_rate=bad_rate=88/342=25.73%,

    ks=25.73% - 0.36% = 25.4%。

  • 表中第二行,

    total_rate=89/891=10.0%,

    good_rate=24/549=4.37%,

    bad_rate=65/342=19.01%,

    cum_good_rate=0.36%+4.37%=4.74%,

    cum_bad_rate=25.73%+19.01%=44.74%,

    ks=44.74%-4.74%=40%
    金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型
    从表中可以发现,当分类阈值设为0.65时,对好坏样本的区分度最高。

  • PSI(Population Stability Index,衡量模型和特征的稳定性)
    金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型
    其中,Ai代表第i组的实际占比(上线后数据),Ei代表第i组的期望占比(训练数据)。
    金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型
    PSI值为0.018,模型稳定。PSI值的衡量标准参考:
    金融风控建模常用指标介绍(WOE, IV, KS, PSI),金融风控,机器学习,数据挖掘,评分卡模型
    注:PSI和IV在取值范围与业务含义的对应上也是存在统一性,只是应用场景不同——PSI用以判断变量稳定性,IV用以判断变量预测能力。文章来源地址https://www.toymoban.com/news/detail-731629.html

到了这里,关于金融风控建模常用指标介绍(WOE, IV, KS, PSI)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)

    项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域) :汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自

    2024年02月13日
    浏览(40)
  • 浅谈金融场景的风控策略

    随着互联网垂直电商、消费金融等领域的快速崛起,用户及互联网、金融平台受到欺诈的风险也急剧增加。网络黑灰产已形成完整的、成熟的产业链,每年千亿级别的投入规模,超过1000万的“从业者”,其专业度也高于大多数技术人员,给互联网及金融平台的攻防对抗带来严

    2024年02月13日
    浏览(56)
  • 数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending

    赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。

    2024年02月05日
    浏览(44)
  • 对一个金融风控测额公式的理解(1)

    目录 公式:(近3个月回款总额/过去3个月的FBA平均库存价值)*最近FBA的库存价值*过去13周FBA发货比例 详细讨论一下这个:(近3个月回款总额/过去3个月的FBA平均库存价值) 既然(近3个月回款总额/过去3个月的FBA平均库存价值)已经可以说明问题了,为什么测额公式,最后还

    2024年02月06日
    浏览(47)
  • 基于【逻辑回归】的评分卡模型金融借贷风控项目实战

    背景知识:         在银行借贷过程中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段。今天我们来复现一个评分A卡的模型。完整的模型开发所需流程包括:获取数据,数据清洗和特征工程,模型开发,模型检验和评估,模型上线,模型检测和报告。 我们

    2024年02月06日
    浏览(42)
  • 数据挖掘项目:金融银行风控信用评分卡模型(上篇)

    数据来自Kaggle的Give Me Some Credit,有15万条的样本数据,网上的分析说明有很多,本人结合其他大佬的方法,对数据进行细致的分析,主要分析在EDA环节,之后尝试使用toad这个评分卡的库,以及使用quct结合卡方检验分箱的方法,使用AUC和KS,结合交叉验证对比分析哪个效果更好

    2024年02月13日
    浏览(58)
  • Datawhale零基础入门金融风控Task1 赛题理解

    Tip:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控之贷款违约预测挑战赛。 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问

    2024年02月21日
    浏览(47)
  • 风控系统指标计算/特征提取分析与实现01,Redis、Zset、模版方法

    个人博客:无奈何杨(wnhyang) 个人语雀:wnhyang 共享语雀:在线知识共享 Github:wnhyang - Overview 引用 AI 对于风控系统的介绍 风控系统是一种用于在线业务的安全管理系统,它帮助企业和平台防范潜在的欺诈、信用风险以及不合规行为。简单来说,它的核心作用就是“保安全

    2024年03月14日
    浏览(42)
  • 53 | 金融行业股票销售指标分析

    引言: 金融行业中的股票销售指标分析是评估股票市场表现、投资者行为以及交易平台效果的重要手段。通过深入分析关键的销售指标,投资者、金融机构和交易平台可以更好地了解市场趋势,作出明智的投资决策,优化交易策略。本文将探讨金融行业股票销售指标分析的重

    2024年02月12日
    浏览(33)
  • 蚂蚁蚁盾发布实体产业「知识交互建模引擎」,最快10分钟定制AI风控模型

    数字化起步晚、数据分散稀疏、专业壁垒高、行业知识依赖「老师傅」,是很多传统产业智能化发展面临的难题。2023年云栖大会上,蚂蚁集团安全科技品牌蚁盾发布“知识交互建模引擎”,将实体产业知识与AI模型有机结合,助力企业最快10分钟定制自主可控的垂直领域AI风控

    2024年02月06日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包