第四章判别分析 Discriminate Analysis)
zf 第四章 判别分析 (Discriminate Analysis)
距离判别贝叶斯( Bayes)判别 费歇尔 Fisher)判别逐步判别 2021/2/22 2 cxt
2021/2/22 2 cxt 距离判别 贝叶斯(Bayes)判别 费歇尔(Fisher)判别 逐步判别
4.1判别分析的基本思想 冷一、什么是判别分析? ◇判别分析 根据知对象的某当观测指标和所属类别来判断未知对象所属类 别的一种统计学方法。 如何判断(判断依据 利用已知类别的样本信息求判别函数,根据 判别函数对未知样本所属类别进行判别 令判别分析的特点(基本思想) 由凌绣奚蓊隍性崟左菊彌法柰剑1 标数据及所属类别的信息,总结 2、根据总结出来的判别公式和判别准则,判别未知类别的样本点所属的类别。 ◆判别分析的目的:识别一个个体所属类别 2021/2/22 cxt
2021/2/22 3 cxt 4.1 判别分析的基本思想 ❖ 一、什么是判别分析? ❖ 判别分析 根据已知对象的某些观测指标和所属类别来判断未知对象所属类 别的一种统计学方法。 如何判断(判断依据)? 利用已知类别的样本信息求判别函数,根据 判别函数对未知样本所属类别进行判别 ❖ 判别分析的特点(基本思想) 1、是根据已掌握的、历史上若干样本的p个指标数据及所属类别的信息,总结 出该事物分类的规律性,建立判别公式和判别准则。 2、根据总结出来的判别公式和判别准则,判别未知类别的样本点所属的类别。 ❖ 判别分析的目的:识别一个个体所属类别
判别分析的应用:无处不在 医学 例1:在医学诊断中,一个病人肺部有阴影,医生要 判断他患的是肺结核、肺部良性肿瘤还是肺癌? 肺结核病人、肺部良性肿瘤病人、肺痘病人组成三 个总体,病人来自其中一个总体,可通过病人的指 标(阴影大小、边缘是否光滑等)用判别分析判断 他来自哪个总体(即判断他患的什么病?) 2021/2/22 4 cxt
2021/2/22 4 cxt ❖ 判别分析的应用:无处不在 医学: 例1:在医学诊断中,一个病人肺部有阴影,医生要 判断他患的是肺结核、肺部良性肿瘤还是肺癌? 肺结核病人、肺部良性肿瘤病人、肺癌病人组成三 个总体,病人来自其中一个总体,可通过病人的指 标(阴影大小、边缘是否光滑等)用判别分析判断 他来自哪个总体(即判断他患的什么病?)
口经济学: 口例2:中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标 Ⅺ总负债率(现金收益/总负债) X2收益性指标(纯收入总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进 行了调查,得如下资料: 2021/2/22 5 cxt
2021/2/22 5 cxt 经济学: 例2:中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标: X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进 行了调查,得如下资料:
总负债率收益性指标短期支付能力生产效率指标类别 -,45 1.09 45 .56 31 1.51 16 09 1.45 26 10 0 1.56 67 -14 三71 28 23 30 22 18 07 02 1.31 25 01 00 2.15 70 28 23 1.19 ,15 05 188 27 37 1.99 08 08 1.51 42 05 1.68 95 00 1.26 60 12 1.14 17 -28 27 1.27 51 10 2.49 54 2 08 02 2.01 53 2 2021/2/22 6
2021/2/22 6 cxt 总负债率 收益性指标 短期支付能力 生产效率指标 类别 -.45 -.41 1.09 .45 1 -.56 -.31 1.51 .16 1 .06 .02 1.01 .40 1 -.07 -.09 1.45 .26 1 -.10 -.09 1.56 .67 1 -.14 -.07 .71 .28 1 -.23 -.30 .22 .18 1 .07 .02 1.31 .25 1 .01 .00 2.15 .70 1 -.28 -.23 1.19 .66 1 .15 .05 1.88 .27 1 .37 .11 1.99 .38 1 -.08 -.08 1.51 .42 1 .05 .03 1.68 .95 1 .01 .00 1.26 .60 1 .12 .11 1.14 .17 1 -.28 -.27 1.27 .51 1 .51 .10 2.49 .54 2 .08 .02 2.01 .53 2
38 3.27 19 05 2.25 ,32 07 24 12 05 2.52 533995 5 02 02 2.05 22 08 2.35 40 17 07 1.80 ,52 15 05 2.17 55 .10 2.50 58 ,14 03 ,46 ,26 ,14 07 2.61 52 33 09 3.0 48 09 ,56 022994 85 4 2222222222222222222 20 08 30 ,47 14 45 17 04 58 04 5.06 43 04 01 1.50 71 待判 20220061:3740待判
2021/2/22 7 cxt .38 .11 3.27 .55 2 .19 .05 2.25 .33 2 .32 .07 4.24 .63 2 .31 .05 4.45 .69 2 .12 .05 2.52 .69 2 -.02 .02 2.05 .35 2 .22 .08 2.35 .40 2 .17 .07 1.80 .52 2 .15 .05 2.17 .55 2 -.10 -1.01 2.50 .58 2 .14 -.03 .46 .26 2 .14 .07 2.61 .52 2 -.33 -.09 3.01 .47 2 .48 .09 1.24 .18 2 .56 .11 4.29 .45 2 .20 .08 1.99 .30 2 .47 .14 2.92 .45 2 .17 .04 2.45 .14 2 .58 .04 5.06 .13 2 .04 .01 1.50 .71 待判 -.06 -.06 1.37 .40 待判
07 01 1.37 34 待判 13 14 1.42 44 待判 15 06 2.23 56 待判 16 05 2.31 20 待判 29 06 84 38 待判 54 2.33 48 「待判 2021/2/22 8 cxt
2021/2/22 8 cxt .07 -.01 1.37 .34 待判 -.13 -.14 1.42 .44 待判 .15 .06 2.23 .56 待判 .16 .05 2.31 .20 待判 .29 .06 1.84 .38 待判 .54 .11 2.33 .48 待判
企业判别判别函数「判别为1的判别的为2 概率 率 -56509 69479 30521 1 -89817 80234 19766 234 -59642 7062029380 1.02182 83420 ,16580 5 25719 35312 64688 2222 34253 32005 67995 678 27925 34442 65558 1.24010 09012 90988 2021/2/22 cxt
2021/2/22 9 cxt 企业 序号 判别 类型 判别函数 得分 判别为1的 概率 判别的为2 概率 1 1 -.56509 .69479 .30521 2 1 -.89817 .80234 .19766 3 1 -.59642 .70620 .29380 4 1 -1.02182 .83420 .16580 5 2 .25719 .35312 .64688 6 2 .34253 .32005 .67995 7 2 .27925 .34442 .65558 8 2 1.24010 .09012 .90988
口例3:根据信息基础设施的发展状况,对世界 20个国家和地区进行分类。 考察指标有6个: 1、X1:每干居民拥有固定电话数目 2、X2:每千人拥有移动电话数目 3、X3:高峰时期每三分钟国际电话的成本 4、X4:每干人拥有电脑的数目 5、X5:每干人中电脑使用率 6、X6:每千人中开通互联网的人数 2021/2/22 10 cxt
2021/2/22 10 cxt 例3:根据信息基础设施的发展状况,对世界 20个国家和地区进行分类。 考察指标有6个: 1、X1:每千居民拥有固定电话数目 2、X2:每千人拥有移动电话数目 3、X3:高峰时期每三分钟国际电话的成本 4、X4:每千人拥有电脑的数目 5、X5:每千人中电脑使用率 6、X6:每千人中开通互联网的人数