书籍详情
《Python金融大数据风控建模实战:基于机器学习王青天孔越机械工业》[23M]百度网盘|亲测有效|pdf下载
  • Python金融大数据风控建模实战:基于机器学习王青天孔越机械工业

  • 出版社:北方图书城旗舰店
  • 出版时间:2020-06
  • 热度:5232
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

   图书基本信息
图书名称   Python金融大数据风控建模实战:基于机器学习
作者   王青天孔越
定价   119元
出版社   机械工业出版社
ISBN   9787111655794
出版日期   2020-06-01
字数   
页码   
版次   
装帧   平装
开本   16开
商品重量   

   内容提要
本书的定位是一本Python金融大数据风控建模的入门级读物。全书包括4篇:背景篇旨在由浅入深地读者走进金融科技领域,了解智能风控,系统、全面地认识评分卡;基础篇围绕评分卡构建的全流程,向读者一一讲述每个环节的理论知识,随之进行代码实践,帮助读者获得从0至1构建评分卡模型的工程能力;进阶篇旨在从建模中可能遇到问题出发,提供一些问题解决或模型提升的思路,使建立的评分卡具有更好的业务适应及预测能力;实战篇结合真实信贷场景的数据集,带领读者完成从数据分析至评分卡生成的各个流程,旨在让读者体验真实场景,具备评分卡实战能力,亦可作为读者实际工作中构建评分卡的参考。本书适合有Python语言基础的金融风控相关技术人员阅读,也适合想要了解人工智能如何在金融场景应用的开发及业务人员。另外,也适合专业培训机构的学员和相关专业的学生。

   目录
前言
篇 智能风控背景
章 金融科技介绍2
1.1 金融科技的前世今生2
1.2 金融科技正深刻地改变和塑造着金融业态4
1.3 新兴科技不断强化金融科技的应用能力5
1.4 金融风险控制面临着的挑战7
1.5 智能风控和评分卡8
1.6 评分卡模型的开发流程11
第2章 机器学习介绍17
2.1 机器学习的概念17
2.2 机器学习的分类17
2.2.1 有监督学习18
2.2.2 无监督学习18
2.2.3 强化学习19
2.3 机器学习与人工智能的关系20
2.4 机器学习与数学的关系20
2.5 机器学习与深度学习22
第3章 评分卡模型介绍25
3.1 申请评分卡25
3.1.1 数据获取26
3.1.2 好坏样本定义26
3.1.3 观察期与表现期确定29
3.1.4 样本分层32
3.1.5 数据清洗与预处理33
3.1.6 特征工程33
3.1.7 模型训练与优化35
3.2 行为评分卡36
3.2.1 数据获取37
3.2.2 时间窗口37
3.2.3 特征工程38
3.3 催收评分卡40
3.3.1 催收评分卡分类40
3.3.2 催收策略41
3.4 反欺诈模型42
3.4.1 欺诈风险与信用风险比较42
3.4.2 欺诈模型好坏样本定义43
3.4.3 欺诈主体分析44
3.4.4 反欺诈方法介绍44
第2篇 评分卡理论与实战基础
第4章 数据清洗与预处理48
4.1 数据集成49
4.2 数据清洗50
4.3 探索性数据分析52
4.4 Python代码实践54
4.4.1 数据集成54
4.4.2 数据清洗58
4.4.3 探索性数据分析61
第5章 变量编码方法66
5.1 无监督编码66
5.1.1 One-hot编码66
5.1.2 Dummy variable编码68
5.1.3 Label编码69
5.2 有监督编码70
5.2.1 WOE编码70
5.2.2 WOE编码与One-hot编码比较73
5.3 Python代码实践75
5.3.1 One-hot编码76
5.3.2 Dummy variable编码80
5.3.3 Label编码82
5.3.4 WOE编码85
第6章 变量分箱方法89
6.1 变量分箱流程91
6.2 Chi-merge卡方分箱方法92
6.3 Best-KS分箱方法94
6.4 IV分箱方法95
6.5 基于树的分箱方法95
6.6 Python代码实践98
6.6.1 Chi-merge分箱98
6.6.2 IV分箱106
6.6.3 基于树的分箱107
第7章 变量选择109
7.1 过滤法变量选择109
7.2 包装法变量选择112
7.3 嵌入法变量选择113
7.4 Python代码实践115
7.4.1 过滤法变量选择115
7.4.2 包装法变量选择118
7.4.3 嵌入法变量选择120
第8章 Logistic回归模型123
8.1 Logistic回归模型原理123
8.2 过拟合与欠拟合128
8.3 Python代码实践130
第9章 模型的评估指标136
9.1 正负样本的选择137
9.2 标准评估指标139
9.3 概率密度评估指标141
9.4 概率分布评估指标144
9.5 Python代码实践153
0章 评分卡分数转化157
10.1 由概率到分数的转换157
10.2 变量的分值计算159
10.3 评分卡性能评估161
10.4 Python代码实践163
1章 模型在线监控169
11.1 稳定性监控169
11.2 单调性监控172
11.3 性能监控指标173
11.4 Python代码实践174
第3篇 评分卡理论与实战进阶
2章 样本不均衡处理180
12.1 数据层下采样样本不均衡的处理方法181
12.1.1 下采样方法181
12.1.2 样本邻域选择的下采样方法182
12.1.3 样本邻域清理的下采样方法184
12.1.4 Bagging集成的下采样方法185
12.1.5 Boosting集成的下采样方法187
12.2 数据层上采样样本不均衡的处理方法188
12.2.1 上采样方法188
12.2.2 SMOTE样本生成方法189
12.2.3 Borderline-SMOTE样本生成方法190
12.3 算法层样本不均衡的处理方法190
12.4 模型评估层样本不均衡的处理方法191
12.5 Python代码实践191
12.5.1 数据层下采样样本不均衡处理代码实现192
12.5.2 数据层上采样样本不均衡处理代码实现201
3章 特征工程进阶206
13.1 数据层特征工程206
13.2 算法层特征工程211
13.2.1 基于树模型的特征生成211
13.2.2 FM特征交叉215
13.3 Python代码实践219
13.3.1 数据层特征工程代码实现219
13.3.2 算法层特征工程代码实现222
4章 决策树模型229
14.1 决策树模型的原理229
14.2 决策树学习229
14.3 决策树与过拟合234
14.4 Python代码实践236
5章 神经网络模型241
15.1 神经元模型241
15.2 神经网络的网络结构242
15.3 神经网络的学习策略247
15.4 Python代码实践253
6章 支持向量机模型257
16.1 感知器模型257
16.1.1 感知器模型的原理257
16.1.2 感知器与支持向量机模型260
16.2 线性可分支持向量机261
16.3 线性支持向量机267
16.4 非线性支持向量机272
16.5 感知器相关模型比较278
16.6 Python代码实践280
16.6.1 线性支持向量机模型代码实现280
16.6.2 非线性支持向量机模型代码实现282
7章 集成学习286
17.1 Bagging与Boosting对比286
17.2 Random Forest模型原理288
17.3 Adaboost模型原理289
17.4 GBDT模型原理292
17.5 Xgboost模型原理297
17.6 Python代码实践304
17.6.1 Random Forest模型304
17.6.2 Adaboost模型308
17.6.3 GBDT模型310
17.6.4 Xgboost模型313
8章