现如今,人们对于征信的重视程度越来越高,消费类信贷的井喷式需求更是不断推动着信用评分机制的发展。金融机构可以根据信用评分等级决定授信额度、利率等,客户也可以通过了解自己的信用分数,更好地做出决策。
然而,贷款审批时,审批人拿到的信息往往是零散且不规范的,操作起来十分复杂,效率低下。通过信用评分模型,对审批人而言,只需要输入客户的数据,就能得到一个参考性很高的分数。
本项目通过对 kaggle 上的数据进行挖掘分析,结合信用评分卡的建立原理,使用R语言完成从数据的预处理、建模分析到创建信用评分卡。
完整报告目录如下:
一、项目背景
1.1 概述
1.2 数据来源
1.3 目标
二、数据预处理
2.1 数据字典概览
2.2 导入数据
2.3 缺失值处理
2.4 异常值处理(x1-x10)
2.5 变量相关性处理
2.6 变量分箱(x1-x10)
三、建模
3.1 建立逻辑回归模型
3.2 VIF检验
四、构建评分卡
4.1 对模型的变量进行打分
4.2 生成每行对应的分数
4.3 模型评估
4.4 生成评分卡并导出
4.5 个人评分案例计算
五、参考资料