金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

这篇具有很好参考价值的文章主要介绍了金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

各位朋友,最新金融风控模型竞赛开始了!竞赛名称为金融大数据应用:企业信贷风险防控;组织单位:数字中国建设峰会组委会;中国建设银行提供模型竞赛数据集。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

这次模型竞赛奖金很高,总奖金160万元,一等奖八万元。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

赛题背景:
  金融机构的数字化转型正在如火如荼地进行,人工智能作为数字化转型的重要手段之一,全方位融合赋能金融行业的业务领域和场景应用。目前人工智能技术在金融产品设计、市场营销、风险控制、客户服务和其他支持性活动等金融行业五大业务链环节均有渗透,特别是以生物特征识别、机器学习、计算机视觉、知识图谱等技术赋能下的金融行业,已经衍生出智能营销、智能身份识别、智能客服等多个金融人工智能典型场景。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

 赛题任务
  1.将金融数据与政务数据相结合,可自备行业数据丰富模型维度。从需求分析、场景设计、解决方案、落地验证、产品价值多个方面开展创意设计,提交创意解决方案。
  2.企业信贷风险防控方案。结合企业数据与公共数据,建立企业信贷风险分析模型。场景方向可从准入管理、预警监控、信贷调整、贷后管理等方面,对企业各方面的风险进行评估,结合模型及业务场景设计完整的风险防控方案,提升银行信贷风险防控能力。

参赛规则

▶▶ 参赛人群:大赛面向社会各界开放,不限年龄国籍、高校、科研院所、企业从业人员均可登录官网报名参赛。参与大赛组织工作有关单位员工可参赛但不可获奖;
▶▶ 报名要求:每道赛题每人仅能参加一支团队(1-5人),可同时选择多道赛题进行参赛,不同赛题可以拥有不同的团队,报名时所有成员需提供个人基本信息,并通过实名认证;需在组队截止日期前完成组队,一旦组队不可退出队伍。组队条件:各成员提交总次数≤开赛天数*3,且一个团队至少有一名中国籍选手;更多参赛规则可访问官网主页。

数据说明

这次Toby老师也下载了模型竞赛数据,观察这次数据集的变量是公开透明的。这意味着此次模型竞赛非常有意义,我们能通过数据挖掘和建模方法找出有价值变量和业务意义。

下图是中国建设银行提供数据集,共47个变量,12万客户数据,数据量还算比较大。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

  企业信贷风险防控数据主要包括企业工商信息、法人基本信息、公积金缴交等金融数据与政务数据(均为模拟数据),数据字典已包含。其中训练集与测试集可由选手根据方案实际情况自行划分,选手也可自备数据丰富方案维度。

提交要求

  参赛者须在初赛阶段提供解决方案设计说明书(PPT、WORD或PDF格式)和成果模型。内容需包括但不限于:
  背景分析 —— 具有现实意义、面向金融业实际面对的问题,结合具体情况,分析业务现状、当前痛点、难点;
  实施方案 —— 基于背景分析,设计数字化场景,提出可解决问题、降低金融风险、提升客户体验的创新思路实施方案;
  数据分析 —— 对数据的选取、使用过程进行分析,包括数据清洗过程、字段筛选、重要性分析等;
  算法分析 —— 对建模使用的具体算法进行分析介绍,包括算法选择原因、调参过程等进行分析说明;
  作品价值 —— 体现作品的实际落地价值,通过可度量的指标进行体现。

提交示例

  解决方案设计说明书可以是PPT、WORD或PDF格式,文件名以“赛题名称+团队名称+方案名称”为准。
  如有影音、数据、模型等文件,请打包在同一个文件夹压缩后进行提交。

评测标准

  大赛主办方组建大赛专家评审团负责比赛评审工作。
  大赛专家评审团根据各指标比例及对应参考描述,以百分制方式,对参赛者作品进行打分。评审标准暂拟如下,仅供参考,根据大赛实际组织情况调整,以实际评审标准为准。

评分维度作品成熟度技术水准应用潜力答辩表现占比40%30%20%10%

  ● 作品成熟度(40%)
  (1)需求分析(10%):具有较强社会意义、金融行业实际需求的问题,基于对数据的处理分析,结合真实情况,有效把握需求痛点、难点、堵点;
  (2)场景设计(10%):基于需求分析,设计数字化场景,提出可解决问题、减少社会成本、提高效益的创新思路;
  (3)解决方案(10%):基于赛题场景设计,提出符合金融需求的可落地解决方案,形成较完善的分析报告或综合方案;
  (4)数据使用(10%):对于系统构建所需数据有较清晰的数据清单,其中或包括数据类别、数据格式、数据功能、数据来源等信息,并对数据使用流程做出较清晰规划。
  ● 技术水准(30%)
  (1)先进性(5%):有效使用云计算、大数据、人工智能等技术,且技术能力领先市场已有应用,具备技术先进性;
  (2)创新性(20%):解决问题的思路、方案具有较强的创新性,与传统方法有明显的区别与升级;
  (3)成熟度(5%):方案深入行业需求,能够有效解决行业痛点问题,并针对未来实施过程中可能遇到的风险问题做出预测,并提出相应预案。
  ● 应用潜力(20%)
  (1)实用性(5%):作品方案符合实际使用场景需求,可落地应用,解决真实业务难题;
  (2)普适性(5%):作品方案具有较强的普适性,可适用于多种场景,解决多类问题;
  (3)社会效益(5%):作品方案实际应用后,可产生较大社会效益,切实助力惠民、兴业、优政;
  (4)商业价值(5%):作品方案可高效率、低费用应用,具有较强的商业价值、推广潜力。
  ● 答辩表现(10%)
  答辩时仪态得体,语言表达逻辑清晰,合理解答专家疑问,展现了较为丰富的经验和专业的能力。

Toby老师指出这次模型竞赛非常open,不是之前以单个指标(accuracy/AUC/F1 score)来排名,而是对参赛者多个方面考察。之前我写的文章《四川省大学生金融科技建模大赛-模型复现和点评》提出过主办方改进建议,如下图。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

貌似主办方看过这篇文章,这次项目的确弥补了之前缺点,堪称经典。这次比赛非常经典,建议大家都去参与,提高自己建模能力。

开箱测试

Toby老师下载数据后开箱测试,先绘制变量直方图和相关性热图,投石问路。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

Toby老师建议大家不要急着建模,先观察数据分布特征,这类似进攻前的情报收集工作。

Toby老师通过描述性统计,发现这数据集需要大量预处理工作,对初学者有一定难度。例如时间变量比较多,可以做衍生变量。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

此数据集夹杂着错误数据,如果参赛者没有自动化检测工具,很难发现里面埋的坑。例如贷款申请时间里有2999年数据,法人出生日期有3019年数据,这是什么东东?

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

脏数据意味着中国建设银行复杂数据库员工工作不仔细,或者故意输入几个错误数据。脏数据很正常,因为数据量太大了,我们经常遇到。

Toby老师初次建模观察,模型性能解决完美。如果是经验不足选手,估计已经高兴地晕过去。对于我们来说,模型质量好的可疑,我们要去仔细检查变量业务意义。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

果不其然,变量存在数据泄露风险。至于什么是数据泄露,请大家阅读之前我写的文章《数据泄露-揭秘机器学习模型如何作弊》。

Toby老师通过多轮变量筛选,删除疑似数据泄露变量后,最后用34个变量建模,模型性能非常棒。通过建模,我发现数据集存在多个强变量。中国建设银行拥有这些强变量,风控能力会非常不错。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

Toby老师入模的34个变量中,高相关性变量已经非常少。如果更严格一些,这34个变量还可以继续筛选。此模型用10-20个变量,足以发挥优秀性能。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

如下图,模型AUC为0.98,当然我可以做的更高,这属于前几轮测试数据,模型调参等提高模型性能方法还没用。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

有的变量重要性比较低,但业务意义比较重要,我还是建议保留,继续收集更多数据后观察实验。我们建模不能只看统计结果,还要尊重业务意义。数据建模和业务意义类似于太极的阴和阳,两者缺一不可,互相平衡方能发挥最好效果。

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

总结

金融大数据应用-企业信贷风险防控模型竞赛是一次非常棒的比赛!鼓励大家多去参与。如果大家想学习风控建模方法和代码,可关注Toby老师自研课程《python金融风控评分卡模型和数据分析》。教程包含逻辑回归,集成树,神经网络等常见算法介绍和代码,有大量实战案例,模型性能优越,适用于论文,作业,专利,模型竞赛,企业模型。欢迎大家收藏,以备工作和学习使用。

如果有模型竞赛定制需求朋友,可给博主留言。

版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。文章来源地址https://www.toymoban.com/news/detail-409400.html

到了这里,关于金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

    进入21世纪,生命科学特别是基因科技已经广泛而且深刻影响到每个人的健康生活,于此同时,科学家们借助基因科技史无前例的用一种全新的视角解读生命和探究疾病本质。人工智能(AI)能够处理分析海量医疗健康数据,通过认知分析获取洞察,服务于政府、健康医疗机构

    2023年04月09日
    浏览(58)
  • Python在金融分析中的应用:量化投资与风险管理

    本文将探讨Python在金融分析中的应用,重点关注量化投资与风险管理。我们将通过实际的代码示例和应用场景,了解Python在量化策略开发、风险评估和投资组合优化等方面的重要作用。 随着金融市场的不断发展和科技的日新月异,量化投资和风险管理在金融领域变得越来越重

    2024年02月09日
    浏览(40)
  • 银行智能风险防控系统(第一版)

    需求工程5组第一阶段需求文档 目录 1.引言... 1 1.1项目目的.... 1 1.2项目范围.... 2 1.3 项目概览.... 3 2.项目总体描述... 3 2.1产品前景.... 3 2. 2产品功能.... 4 2. 3系统架构.... 4 2. 4 安全性和隐私.... 5 2.5受众分析:.... 5 2. 6用户界面和用户体验.... 6 2. 7技术实现.... 6 2. 8项目实施计划

    2024年02月10日
    浏览(25)
  • 2023大湾区杯粤港澳金融数学建模竞赛思路+模型+代码

    目录 一.思路模型见文末名片,比赛开始第一时间更新 二.大湾区杯常用算法之主成分分析法(PCA) 三.MATLAB代码 四.国赛建模思路获取见此 主成分分析法(PCA)是一种高效处理多维数据的多元统计分析方法,将主成分分析用于多指标(变量)的综合评价较为普遍。笔者自从本科学习

    2024年02月07日
    浏览(42)
  • 锦程消费金融业务生变:App下架,部分自营信贷暂停

    来源 | 镭射财经(leishecaijing) 被誉为消金房抵一哥的锦程消费金融,调整旗下自营信贷业务,展业回归房抵场景。 「镭射财经」独家获悉,锦程消费金融已暂停部分自营小额信贷业务,旗下锦囊贷App已经下架,目前自营信贷仅向存量房抵客户和公积金客户开放。公开资料显

    2024年02月13日
    浏览(37)
  • 采购风险管控,数字化(电子化)招采系统全方位风险防控解决方案

    采购风险管控是采购整体管控的一个重要组成部分,有时甚至决定采购工作的成败。 信源信息基于多年行业经验和优质客户案例的积累,对招标采购全过程进行风险识别、预警与控制,确保招标采购依法合规、风险可控,形成一套较为完整的解决方案 ,为企业招标采购实现

    2024年01月16日
    浏览(56)
  • 区块链与金融数据分析:实现高效的风险控制

    区块链技术在过去的几年里取得了显著的进展,尤其是在金融领域。金融数据分析在金融市场中扮演着关键角色,因为它可以帮助金融机构更好地管理风险,提高投资回报。然而,传统的金融数据分析方法存在一些局限性,如数据不完整、不可靠、不能实时更新等。区块链技

    2024年04月10日
    浏览(56)
  • 企业年报API的应用:从金融投资到市场研究

    引言 在数字化时代,企业年报不再仅仅是一份财务报告,它们变成了宝贵的信息资源,可用于各种商业应用。企业年报API已经改变了金融投资和市场研究的方式,使得从中获取数据变得更加高效和灵活。本文将深入探讨企业年报API的应用,从金融投资到市场研究,展示了它们

    2024年02月07日
    浏览(46)
  • 【二等奖方案】大规模金融图数据中异常风险行为模式挖掘赛题「Aries」解题思路

    第十届CCF大数据与计算智能大赛(2022 CCF BDCI)已圆满结束, 大赛官方竞赛平台DataFountain (简称DF平台)正在陆续释出各赛题获奖队伍的方案思路,欢迎广大数据科学家交流讨论。 本方案为 【大规模金融图数据中异常风险行为模式挖掘】 赛题的 二等奖 获奖方案,赛题地址:

    2024年02月10日
    浏览(40)
  • 【一等奖方案】大规模金融图数据中异常风险行为模式挖掘赛题「NUFE」解题思路

    第十届CCF大数据与计算智能大赛(2022 CCF BDCI)已圆满结束, 大赛官方竞赛平台DataFountain (简称DF平台)正在陆续释出各赛题获奖队伍的方案思路,欢迎广大数据科学家交流讨论。 本方案为 【大规模金融图数据中异常风险行为模式挖掘】 赛题的 一等奖 获奖方案,赛题地址:

    2024年02月10日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包