智能风控体系之逻辑回归

这篇具有很好参考价值的文章主要介绍了智能风控体系之逻辑回归。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏。在信贷风控领域最常用的广义线性模型就是逻辑回归。其实逻辑回归线性可分和线性回归里面的单/多变量线性回归类似,只不过在原有的基础上增加了sigmod函数。其使用的分类函数是sigmoid函数,其可以将模型结果输出约束在【0,1】之间

逻辑回归主要用于解决分类问题,比如:客户是否该买某个商品,借款人是否会违约等问题。实际上,“分类”是逻辑回归的目标和结果,中间过程依旧是涉及“回归”问题,因为通过逻辑回归模型,我们得到的是0-1之间的连续型结果值,即概率,例如借款人未来违约的概率。然后给这个概率加上一个合理的阈值,就变成了分类问题。

▍逻辑回归原理

首先二分类的问题,输出概率P大于某个值时,则判别为类别A,输出概率P小于某个值的时候判为类别B。sigmod函数主要作用是:对于任意实数,那么对应任何的y的取值范围,即将输入的任意实数映射到0-1之间,实现了数值到概率的转换。具体函数为:

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

逻辑回归的预测函数:

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

逻辑回归参数求解:上面得到了预测函数,那么我们如何求解参数呢?这里采用了最大似然估计。其中极大似然估计是数理统计中参数估计的一种重要方法。

▍逻辑回归求解

基于极大似然估计进行逻辑回归模型最优参数求解,根据定义损失函数。例如信贷风控违约问题来说,目标函数Y为0就是未违约,1就是已违约。逻辑回归模型预测的Yn根据合理阈值会进行分类,落到0或1分类上。求解损失函数(所有样本的|Y-Yn|求和)最小化问题的最优模型参数,再结合AUC和KS来判断模型性能效果。

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

其思想就是一个事件发生了,那么发生这个事件的概率就是最大的。这里我们可以这么理解:我们有一批数据,并且他们对应的分类A,B用0,1来表示,即对应的,我们希望寻找一组参数使得每组数据发生得概率最大(最好每个数据x都和其分类一一对应)。即:

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

对数似然函数为:

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

最大似然估计就是求使l(θ)取最大值时的θ,其实这里也可以使用梯度上升法求解,求得的θ就是要求的最佳参数。

正则化项主要是对各个参数的权重做控制的函数,也是惩罚项,它可以让整个曲线更平滑,可以有效的抑制过拟合。学习过程中,我们碰到的就是「L1正则化项、L2正则化项」,它们分别又被称为:「lasso回归项、岭回归项」。L1有一个特殊的功能:它可以稀疏化的取值,即会让某些值为0。L2正则化可以防止模型过拟合,在一定程度上,L1也可以防止过拟合,提升模型的泛化能力

过拟合问题,模型训练过程中要避免过拟合问题,下面左图即为欠拟合,中图为合适的拟合,右图为过拟合:

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

▍逻辑回归应用

当数据不能够通过线性边界(直线、平面等)进行区分分类的时候,为了更好的拟合数据,这个时候就需要考虑从每个数据点建立更多特征来预测。

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

在这个高维特征向量上训练的逻辑回归模型分类器将具有更复杂的决策边界,并且在我们的二维XY图中绘制时将呈现非线性,这就是逻辑回归中的线性不可分。

智能风控体系之逻辑回归,智能风控,人工智能,数据挖掘,金融,数据分析,学习

逻辑回归是在线性回归的基础上加了一个 Sigmoid 函数(非线性)映射,使得逻辑回归称为了一个优秀的分类算法。两者都属于广义线性模型,但它们两个要解决的问题不一样,逻辑回归解决的是分类问题,输出的是离散值,线性回归解决的是回归问题,输出的连续值。在信贷风控业务中,一般求解的变量参数不能为负数,因为需要将逻辑回归模型预测的概率进行转换成评分卡模型的分数0-1000之间。其中要求属性点数为正、总分数为正、分数某个值代表特定的信用质量、分数差异代表统一的信用质量变化。

from sklearn.linear_model import LogisticRegression
Model = LogisticRegression()
Model.fit(X_train, y_train)
Model.score(X_train,y_train)
# Equation coefficient and Intercept
Print(‘Coefficient’,model.coef_)
Print(‘Intercept’,model.intercept_)
# Predict Output
Predicted = Model.predict(x_test)

参考文献:

[1] https://blog.csdn.net/weixin_60737527/article/details/124141293

[2] https://zhuanlan.zhihu.com/p/74874291

[3] https://cloud.tencent.com/developer/article/1412823

[4] https://zhuanlan.zhihu.com/p/352437358

[5] 逻辑回归算法之如何实现客户逾期还款业务文章来源地址https://www.toymoban.com/news/detail-832872.html

到了这里,关于智能风控体系之逻辑回归的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 初识人工智能,一文读懂机器学习之逻辑回归知识文集(1)

    🏆作者简介,普修罗双战士,一直追求不断学习和成长,在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验,历任核心研发工程师,项目技术负责人。 🎉欢迎 👍点赞✍评论⭐收藏 🔎 人工智能领域知识 🔎 链接 专栏 人工智能专业知识学习一 人工智能专栏 人

    2024年01月23日
    浏览(58)
  • 【数据挖掘与人工智能自然语言处理】自然语言处理和人工智能:如何利用自然语言处理技术进行数据挖掘

    作者:禅与计算机程序设计艺术 随着互联网和大数据时代的到来,数据挖掘已成为各个行业的热门话题。数据挖掘的核心在于发现数据中的有价值信息,而自然语言处理(NLP)技术是实现这一目标的重要手段。本文旨在通过自然语言处理技术进行数据挖掘,为数据挖掘提供一

    2024年02月05日
    浏览(94)
  • AI概念之人工智能、机器学习和数据挖掘之间的联系与区别

    本文深入探讨人工智能、机器学习和数据挖掘之间的联系与区别,涵盖基础知识、工作流程、需求分析、设计方案、实现步骤、代码示例、技巧与实践、常见问题与解答等内容,旨在帮助读者全面了解这三者之间的异同,并学会如何在实际工作中运用它们。 阅读时长:约30分

    2024年03月12日
    浏览(76)
  • 人工智能技术体系概览

    人工智能是当今科技领域中备受关注的前沿技术之一。它涵盖了广泛的知识领域,作为学习者每个人的学习路径不同,但是基本包含数学基础、计算机基础、基础与算法、开发框架、模型训练、机器视觉、自然语言、语音识别、商业智能、机器人等多个方面。我们将按照以下

    2024年01月21日
    浏览(37)
  • 1024程序员狂欢节 | IT前沿技术、人工智能、数据挖掘、网络空间安全技术

    一年一度的1024程序员狂欢节又到啦!成为更卓越的自己,坚持阅读和学习,别给自己留遗憾,行动起来吧! 那么,都有哪些好书值得入手呢?小编为大家整理了前沿技术、人工智能、集成电路科学与芯片技术、新一代信息与通信技术、网络空间安全技术,四大热点领域近期

    2024年02月06日
    浏览(64)
  • 【数据挖掘与人工智能可视化分析】可视化分析:如何通过可视化技术进行数据挖掘和发现

    作者:禅与计算机程序设计艺术 数据挖掘(Data Mining)和人工智能(Artificial Intelligence,AI)已经成为当今社会热点话题。这两者之间的结合也带来了很多挑战。作为数据科学家、机器学习工程师、深度学习研究员等,掌握了数据的获取、清洗、处理、建模、应用这些技术的前提下,

    2024年02月07日
    浏览(74)
  • 《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

    进入21世纪,生命科学特别是基因科技已经广泛而且深刻影响到每个人的健康生活,于此同时,科学家们借助基因科技史无前例的用一种全新的视角解读生命和探究疾病本质。人工智能(AI)能够处理分析海量医疗健康数据,通过认知分析获取洞察,服务于政府、健康医疗机构

    2023年04月09日
    浏览(58)
  • 智能车辆与人工智能:构建未来出行的智能交通体系

    作者:禅与计算机程序设计艺术 在未来的出行中,智能车辆将成为最具决定性的角色。无论是用在出租汽车、打车还是共享单车,都将越来越多地融入到生活中,促进人们的出行模式的升级换代。未来智能车辆还会涉及各种新的应用场景,如通勤或特殊的交通工具。如此之多

    2024年02月06日
    浏览(60)
  • 风险风控-逻辑回归理论基础

    逻辑回归一般都应用于传统的建模方案,因其模型含义易解释,容易推广上线而得到大家的青睐 逻辑回归于广义线性模型: 逻辑回归是广义线性模型(Generalized Linear Models,GLM)的一种特殊形式。广义线性模型是线性回归模型的推广,它不强行改变数据的自然度量,允许数据

    2024年02月05日
    浏览(34)
  • 人工智能AI 全栈体系(一)

    这些年人工智能蓬勃发展,在语音识别、图像识别、自然语言处理等多个领域得到了很好的应用。推动这波人工智能浪潮的无疑是深度学习。所谓的深度学习实际上就是多层神经网络,至少到目前为止,深度学习基本上是用神经网络实现的。神经网络并不是什么新的概念,早

    2024年02月09日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包