数据挖掘实用案例分析 指掘第6章银行信用卡欺诈与拖欠行 实用案例分析 为分析 复旦大学赵卫东博士 0ta间g wdzhao@fudan.edu.cn dicta
数据挖掘实用案例分析 第6章 银行信用卡欺诈与拖欠行 为分析 复旦大学 赵卫东 博士 wdzhao@fudan.edu.cn
章节介绍 本案例获取某银行的客户信用卡记录,挖掘数据的潜在价值,为该银行的 信用卡业务决策提供参考。该银行面临的信用卡欺诈和拖欠现象比较严重 。本案例希望通过对影响用户信用等级的主要因素进行分析,以及结合信 用卡用户的人口特征属性对欺诈行为和拖欠行为的影响因素进行分析 通过对银行的客户信用记录、申请客户信息、拖欠历史信息、消费历史记 录等数据进行分析,对不同程度的客户进行归类,研究信用卡贷款拖欠 信用卡欺诈等问题与客户的个人信息、信用卡使用信息的关系,为银行提 前识别、防控信用卡业务风险提供参考,从而减少银行在信用卡业务方面 的损失
章节介绍 • 本案例获取某银行的客户信用卡记录,挖掘数据的潜在价值,为该银行的 信用卡业务决策提供参考。该银行面临的信用卡欺诈和拖欠现象比较严重 。本案例希望通过对影响用户信用等级的主要因素进行分析,以及结合信 用卡用户的人口特征属性对欺诈行为和拖欠行为的影响因素进行分析 • 通过对银行的客户信用记录、申请客户信息、拖欠历史信息、消费历史记 录等数据进行分析,对不同程度的客户进行归类,研究信用卡贷款拖欠、 信用卡欺诈等问题与客户的个人信息、信用卡使用信息的关系,为银行提 前识别、防控信用卡业务风险提供参考,从而减少银行在信用卡业务方面 的损失
章节结构 客户信用等级影响因素 客户信用卡申请数据预处理 信用卡申请成功影响因素 信用卡客户信用等级影响因素 基于消费的信用等级影响因素 信用卡欺诈判断模型 基于 Apriori算法的欺诈模型 基于判别的欺诈模型 基于分类算法的欺诈模型
章节结构 • 客户信用等级影响因素 – 客户信用卡申请数据预处理 – 信用卡申请成功影响因素 • 信用卡客户信用等级影响因素 • 基于消费的信用等级影响因素 • 信用卡欺诈判断模型 – 基于Apriori算法的欺诈模型 – 基于判别的欺诈模型 – 基于分类算法的欺诈模型
章节结构 欺诈人口属性分析 欺诈人口属性统计分析 基于逻辑回归的欺诈人口属性分析 逾期还款的客户特征 基于决策树分析逾期客户特征 基于回归分析逾期客户特征 根据消费历史分析客户特征 基于聚类分析客户特征 基于客户细分的聚类分析
章节结构 • 欺诈人口属性分析 – 欺诈人口属性统计分析 – 基于逻辑回归的欺诈人口属性分析 – 逾期还款的客户特征 – 基于决策树分析逾期客户特征 – 基于回归分析逾期客户特征 – 根据消费历史分析客户特征 – 基于聚类分析客户特征 – 基于客户细分的聚类分析
客户信用等级影响因素 在客户向银行申请信用卡时,银行会根据用户提供的个人信息进行评分 综合考虑用户的各种指标,对每一项指标都按照一定的标准评分,然后累 积得到客户的信用总评分,为每位客户制定信用等级,给予相应的信用卡 额度
客户信用等级影响因素 • 在客户向银行申请信用卡时,银行会根据用户提供的个人信息进行评分, 综合考虑用户的各种指标,对每一项指标都按照一定的标准评分,然后累 积得到客户的信用总评分,为每位客户制定信用等级,给予相应的信用卡 额度
客户信用卡申请数据预处理 在客户申请信用卡时,主要考虑因素如下所示 表61用户信用等级评 级指标 个人自然情况 个人职业情况 个人收入及财产 个人银行记录 二级指标 龄别 年性 职业类别 年收入 信贷情况 工作年限 居住类型 户籍 车辆情况 婚姻状态 保险缴纳 教育程度
客议程户信用卡申请数据预处理 • 在客户申请信用卡时,主要考虑因素如下所示 表6.1 用户信用等级评价指标 一级指标 个人自然情况 个人职业情况 个人收入及财产 个人银行记录 二级指标 年龄 职业类别 年收入 信贷情况 性别 工作年限 居住类型 户籍 车辆情况 婚姻状态 保险缴纳 教育程度
客户信用卡申请数据预处理 选取“申请客户信息”和“客户信用记录”两个表格,在 SPSS Modeler中按 照关键词“客户号”进行合并,删除重复字段 信用总评分信用等级额度 00009994snu|s 000099994.. Nulls Nulls Nulls nulls 1…男未婚大专外资企业 000099994 Snull$ Nulls SnullSSnulIS 22-女未婚大专私营企业 000998860008良好客户50000通过 25…男未婚 个体户 0009990004优质客户1000过 25.男未婚本科私营企业 0099998 8600好套户50000d--125-未婚本料 L营企业 000999888400良好客户50000通过 870008良好客户50000过 00099998 Nulls nulls Nulls nulls 000099998 Nulls Nulls Nulls Nulls 41.女已婚本科个体户
客议程户信用卡申请数据预处理 • 选取“申请客户信息”和“客户信用记录”两个表格,在SPSS Modeler中按 照关键词“客户号”进行合并,删除重复字段
客户信用卡申请数据预处理 将信用等级为空值的字段填充替换为未通过客户 信用等级 98LAKEGFIELD1
客议程户信用卡申请数据预处理 • 将信用等级为空值的字段填充替换为未通过客户
客户信用卡申请数据预处理 将“客户号”、“客户姓名”、“证件号码”等标识用户的变量过滤 “额度”、“信用总评分”、“信用等级”变量作用重复,将其删除 四 字段:已输入19个,已过滤6个,已重命名0个,已输出13 过虑器 信用总评分 审批结果 犬态 婚姻状态 查看当前字段O查看未使用的字段设置
客议程户信用卡申请数据预处理 • 将“客户号”、“客户姓名”、“证件号码”等标识用户的变量过滤 • “额度”、“信用总评分”、“信用等级”变量作用重复,将其删除
客户信用卡申请数据预处理 “类型”节点属性设置 类型格式注解 读取值人除值人除所有值 缺失 检查 角色 A优质客 无 ⊙目标 1080 画标记 教育程度b名义 回 上海内蒙
客议程户信用卡申请数据预处理 • “类型”节点属性设置