|
|
课程介绍:
, L) h5 l" w; S' C在金融行业中,营销部门和风控部门是两大主要业务部门。本课程将介绍数据分析技术如何应用在营销部门面临的客户流失预警,和风控部门涉及到的零售业违约预测。课程中将使用贴近真实业务场景的数据,并且给出切实可行的解决方法。
4 d% T! l: s* L
2 o; c( g0 I" V2 S( t面向人群: k# K: d7 I9 @) ]9 @
1.对金融业感兴趣,想从事风控或营销业务的学员。7 O' g y W$ G. X# i3 C
2.金融行业数据分析从业人员。 9 T8 R# L' F$ A" ^, u! x
$ X* B% v: S& P
学习收益:
* w- {* w' `! k0 z1.熟悉金融行业业务,助力快速适应金融行业数据分析+ s$ s7 ^7 `8 @8 a+ ^ y6 w
2.掌握客户营销中的流失预警的建模方法,熟悉哪些特征会影响到客户流失
! x/ K- {* }! O: S- }4 s. S. b7 O, e3.掌握风控业务中的违约预测技术,熟悉构建怎样的特征和模型来降低信贷业务中的违约损失
* I! P5 k7 N, U; ?) T3 ]' ]7 a, _/ |3 ~! q
课程目录:' q3 f/ J2 w( ~4 B' S+ q7 Z, J! a# e
第一讲:数据分析基本知识复习
4 c3 A, g4 g3 g1 K1.数据分析的基本概念3 _4 z' R9 t8 f8 z
a.目的
8 ^: j; d7 `7 E. _- @9 H9 I5 j- c4 r, j b.数据获取和清理
; M4 p; f8 J; m6 n+ u: d c.数据的描述性统计
; K2 j$ U, w+ e: J1 C2.数据可视化( Y: T3 L6 z7 X8 C! U7 W* p
3.数据分析的常用模型! M8 ~/ E2 z2 a0 f
a.监督式模型:(广义)线性回归,决策树,随机森林,支持向量机,神经网络
3 w3 E. V9 n1 q+ j' ]3 h b.非监督式模型:聚类分析,因子分析,主成分分析' t! V# T! Q! t
c.半监督式模型
. y, i; L4 v B: L/ a/ W4.数据分析的常用工具! M. }4 s4 q6 K6 y
a.R和Python5 ]% g/ l: K5 |% V
第二课:银行内客户流失预警模型的介绍9 B! i9 t1 }; Q7 A& q! C2 J3 O
1.银行客群和产品的类别/ Z5 G/ R6 _4 V
2.为什么要做客户流失预警模型/ J: f: s1 u8 q6 M/ S# b
3.数据介绍和描述
( l( t8 I) Q9 v" o+ [第三课:金融客户流失预警模型中的数据预处理和特征衍生
4 V* o) E/ R2 c) m4 C1.流失数据中的极端值和缺失值的处理2 E* B% v& ?, \" [" q% h9 J
2.构建流失行为的特征' |1 s0 x5 a! ?
第四课:GBDT模型在流失预警模型中的应用) q: p# y& @2 \* S
1.GBDT模型如何应用在金融客户流失预警模型中
; z) F6 I% b8 z2.如何从客户流失数据中推导GBDT模型的参数7 |& {9 m) H- g" L. x3 C
3.GBDT模型对防范客户流失的指导意义6 c" Q3 R [ n, T6 y
第五课:神经网络模型在流失预警模型中的应用2 @9 l- V3 v/ g9 @! {; G+ N6 _
) Q, K Y$ l$ I% O' A2 V1.神经网络模型如何应用在金融客户流失预警模型中
( r. x4 F3 x; P# |+ t9 e& \2.如何从客户流失数据中推导神经网络模型的参数3 k2 v- `" W# G/ _) [# R+ j% ~
3.神经网络模型对防范客户流失的指导意义
y* ?- N8 U' {9 Z* C V) d4.神经网络模型和GBDT模型在客户流失预警工作中的功效比较
% p+ S& F" F4 T: X第六课:信用卡账户违约预测模型的介绍) t' f& D, @$ g6 c( j0 g! Y
1.信贷违约的基本概念. |- o: c5 p, h! k* U1 o
2.为什么要做违约预测模型6 i9 M$ F% D) T; C
3.信贷违约预测模型的特性8 m" J0 R. O) n( P# \
4.数据介绍和描述6 k4 B$ f/ C: Y$ }
5.非平衡样本问题的定义和解决方法- L' j7 [- m% V5 J
a.过抽样和欠抽样% Z/ Z, R0 b" x, E- _7 p0 F+ @
b.SMOTE算法3 E$ g/ I) K% e) B
第七课:违约预测模型中的数据预处理和特征衍生 8 e# [1 _' H: p3 N/ O
1.构建信用风险类型的特征+ @( Q4 h1 [; o% O/ \1 t; y! Q& C J
2.特征的分箱
8 e: D/ ^9 S' h6 c- F4 k, e a.分箱的优点
?4 |2 b2 s4 b% H5 p b.Best-KS分箱法和卡方分箱法* j, v& P( r U/ {5 y: G
3.特征信息度的计算 `6 R2 H9 t0 [1 ]8 m- l3 v
第八课:违约预测模型中的数据预处理和特征衍生(续)5 M! x2 f9 w9 y" o# k4 F
1.分箱后如何编码
- ?6 j0 r# M) h2 B* W0 e a.WOE的概念、优点和计算: N$ {7 @- Y7 `: G
2.信用风险中的单变量分析和多变量分析: `: |/ {% h9 a t
第九课:逻辑回归模型在违约预测模型中的应用% \+ ?5 i! r: K: F2 \' F8 T9 |3 ^' R
1.逻辑回归在违约预测模型中的作用的概述
5 w* Q* U8 s6 q6 h2.降维的方法
2 ]8 O+ ?7 J3 C" V) r- F! o a.主成分法
9 x) x8 X! m9 G Y6 {$ V3.变量选择的方法7 Y9 i, m4 p) V9 i8 E+ p" i
a.LASSO方法! h6 c+ t: h9 t0 O9 f# B. ?1 o3 u
b.逐步回归法# u; w8 c- P- @5 X X0 h; {+ |
c.随机森林法
' L. G6 \4 K6 R; }1 h# c4.带误判惩罚的逻辑回归模型
^) J! Q) q1 d3 G$ n1 [+ i! W第十课:违约预测模型的评价标准
/ @. P( z- u! K8 e1.模型对违约与非违约人群的区分度' i! c2 s3 Y( [ f
2.模型的准确度衡量:
( o3 z4 \" e5 I a.尽可能抓住足够多的违约人群
' u; }, D% @- P' G2 A$ D: M1 i b.尽可能不误抓非违约人群
- f% p0 S, z+ ^0 l& e2 A6 C2 K* Y( U& y8 G7 Z
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|