正在加载图片...
典型相关分析建立第一对典型变量的原则,是尽量使所建的两个典型变量之 间的相关系数最大化。换句话说,就是在两个变量组各自的总变化中先寻求它们 之间最大的一部分共变关系,并用一对典型变式(量)所描述。于是,第一维度 上的典型相关系数也随之求得。这还意味着上述的共变部分已经被从两组各自的 变化中剥离出来了。然后,继续在两组变量剩余的变化中寻找第二个最大的共变 部分,形成第二对典型变式(量),并解出第二维度上的典型相关。这样的过程 不断继续,直至所有变化部分被剥离完毕。因此,两组观测变量之间的关系可以 由若干对典型变量来代表。各对典型变量之间的典型相关程度依序次逐步下降。 由于每一对典型函数都是根据两组观测变量所拥有的变化作出的,因此实际上能 够得到的典型函数个数等于两组中变量较少的一组的变量个数。 这一步工作可以大大精简信息。 比如第一组中的变量有六个,第二组中的变量有三个。经过典型相关分析的 数据处理,原来九个观测变量现在用六个典型变量来代表(共三对)。应该指出 的是,每组所产生的三个变式可以代表各自所有观测变量变化的全部信息,并不 因为其中有一个组由于从六个观测变量产生三个典型变量而使原来的信息有所损 失 此外,每个典型变量只与另一组的对应典型变量相关,与本组或另一组的所 有其他典型变量都不相关。由于这个性质,由每组变式所代表的本组观测变量的 变化部分可以简单相加,其总和与本组观测变量的总变化相等。也就是说, 原来所有观测变量的总变化现在通过典型变量被表现在三个相互独立的维度 上 最后,精简信息还表现于第三个方面。在使用随机抽样数据的情况下,虽然 我们从样本数据中得到两组变量在三个维度上的典型相关系数(一般很少正好等 于0),为了肯定各个维度上的典型相关不仅在样本中存在,而且在总体中也存 在,就需要进行统计检验。由于这些典型相关系数值是依序次递减的,因此在统 计检验以后往往并不是都能够得到统计显著的结果。因此,对于总体没有推断意 义的那些维度上的联系可以忽略不计,于是我们又排除了一些对于总体推断无用 的信息,使后面的分析专注于更加重要的方面。其实,排除不显著的维度对于典 型相关程度并没有太大损失。根据典型变量的形成特点,序次在前的典型函数代 表着两分组之间典型相关的绝大部分,而被排除的那些序数较后的维度上的典型 相关往往很小。 所以,严格地说,一个典型相关系数描述的只是一对典型变量(式)之间的 相关,而不是两个变量组之间的相关。而各对典型变量之间构成的多维典型相关 310
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有