第二十八章灰色系统理论及其应用 客观世界的很多实际问题,其内部的结构、参数以及特征并未全部被人们了解, 人们不可能象硏究白箱问题那样将其内部机理硏究淸楚,只能依据某种思维逻辑与推断 来构造模型。对这类部分信息已知而部分信息未知的系统,我们称之为灰色系统。本章 介绍的方法是从灰色系统的本征灰色出发,研究在信息大量缺乏或紊乱的情况下,如何 对实际问题进行分析和解决 §1灰色系统概论 客观世界在不断发展变化的同时,往往通过事物之间及因素之间相互制约、相互 联系而构成一个整体,我们称之为系统。按事物内涵的不同,人们已建立了工程技术 社会系统、经济系统等。人们试图对各种系统所外露出的一些特征进行分析,从而弄清 楚系统内部的运行机理。从信息的完备性与模型的构建上看,工程技术等系统具有较充 足的信息量,其发展变化规律明显,定量描述较方便,结构与参数较具体,人们称之为 白色系统;对另一类系统诸如社会系统、农业系统、生态系统等,人们无法建立客观的 物理原型,其作用原理亦不明确,内部因素难以辨识或之间关系隐蔽,人们很难准确了 解这类系统的行为特征,因此对其定量描述难度较大,带来建立模型的困难。这类系统 内部特性部分已知的系统称之为灰色系统。一个系统的内部特性全部未知,则称之为黑 色系统。 区别白色系统与灰色系统的重要标志是系统内各因素之间是否具有确定的关系。 运动学中物体运动的速度、加速度与其所受到的外力有关,其关系可用牛顿定律以明确 的定量来阐明,因此,物体的运动便是一个白色系统。 当然,白、灰、黑是相对于一定的认识层次而言的,因而具有相对性。某人有一 天去他朋友家做客,发现当外面的汽车开过来时,他朋友家的狗就躲到屋角里瑟瑟发抖 他对此莫名其妙。但对他朋友来讲,狗的这种行为是可以理解的,因为他知道,狗在前 不久曾被汽车撞伤过。显然,同样对于“狗的惧怕行为”,客人因不知内情而面临一个 黑箱,而主人则面临一个灰箱。 作为实际问题,灰色系统在大千世界中是大量存在的,绝对的白色或黑色系统是 很少的。随着人类认识的进步及对掌握现实世界的要求的升级,人们对社会、经济等问 题的研究往往已不满足于定性分析。尽管当代科技日新月异,发展迅速,但人们对自然 界的认识仍然是肤浅的。粮食作物的生产是一个实际的关系到人们吃饭的大问题,但同 时,它又是一个抽象的灰色系统。肥料、种子、农药、气象、土壤、劳力、水利、耕作 及政策等皆是影响生产的因素,但又难以确定影响生产的确定因素,更难确定这些因素 与粮食产量的定量关系。人们只能在一定的假设条件(往往是一些经验及常识)下按照 某种逻辑推理演绎而得到模型。这种模型并非是粮食作物生产问题在理论认识上的“翻 版”,而只能看作是人们在认识上对实际问题的一种“反映”或“逼近”。 社会、经济、农业以及生态系统一般都会有不可忽略的“噪声”(即随即干扰)。 现有的硏究经常被“噪声”污染。受随机干扰侵蚀的系统理论主要立足于概率统计。通 过统计规律、概率分布对事物的发展进行预测,对事物的处置进行决策。现有的系统分 415
-415- 第二十八章 灰色系统理论及其应用 客观世界的很多实际问题,其内部的结构、参数以及特征并未全部被人们了解, 人们不可能象研究白箱问题那样将其内部机理研究清楚,只能依据某种思维逻辑与推断 来构造模型。对这类部分信息已知而部分信息未知的系统,我们称之为灰色系统。本章 介绍的方法是从灰色系统的本征灰色出发,研究在信息大量缺乏或紊乱的情况下,如何 对实际问题进行分析和解决。 §1 灰色系统概论 客观世界在不断发展变化的同时,往往通过事物之间及因素之间相互制约、相互 联系而构成一个整体,我们称之为系统。按事物内涵的不同,人们已建立了工程技术、 社会系统、经济系统等。人们试图对各种系统所外露出的一些特征进行分析,从而弄清 楚系统内部的运行机理。从信息的完备性与模型的构建上看,工程技术等系统具有较充 足的信息量,其发展变化规律明显,定量描述较方便,结构与参数较具体,人们称之为 白色系统;对另一类系统诸如社会系统、农业系统、生态系统等,人们无法建立客观的 物理原型,其作用原理亦不明确,内部因素难以辨识或之间关系隐蔽,人们很难准确了 解这类系统的行为特征,因此对其定量描述难度较大,带来建立模型的困难。这类系统 内部特性部分已知的系统称之为灰色系统。一个系统的内部特性全部未知,则称之为黑 色系统。 区别白色系统与灰色系统的重要标志是系统内各因素之间是否具有确定的关系。 运动学中物体运动的速度、加速度与其所受到的外力有关,其关系可用牛顿定律以明确 的定量来阐明,因此,物体的运动便是一个白色系统。 当然,白、灰、黑是相对于一定的认识层次而言的,因而具有相对性。某人有一 天去他朋友家做客,发现当外面的汽车开过来时,他朋友家的狗就躲到屋角里瑟瑟发抖。 他对此莫名其妙。但对他朋友来讲,狗的这种行为是可以理解的,因为他知道,狗在前 不久曾被汽车撞伤过。显然,同样对于“狗的惧怕行为”,客人因不知内情而面临一个 黑箱,而主人则面临一个灰箱。 作为实际问题,灰色系统在大千世界中是大量存在的,绝对的白色或黑色系统是 很少的。随着人类认识的进步及对掌握现实世界的要求的升级,人们对社会、经济等问 题的研究往往已不满足于定性分析。尽管当代科技日新月异,发展迅速,但人们对自然 界的认识仍然是肤浅的。粮食作物的生产是一个实际的关系到人们吃饭的大问题,但同 时,它又是一个抽象的灰色系统。肥料、种子、农药、气象、土壤、劳力、水利、耕作 及政策等皆是影响生产的因素,但又难以确定影响生产的确定因素,更难确定这些因素 与粮食产量的定量关系。人们只能在一定的假设条件(往往是一些经验及常识)下按照 某种逻辑推理演绎而得到模型。这种模型并非是粮食作物生产问题在理论认识上的“翻 版”,而只能看作是人们在认识上对实际问题的一种“反映”或“逼近”。 社会、经济、农业以及生态系统一般都会有不可忽略的“噪声”(即随即干扰)。 现有的研究经常被“噪声”污染。受随机干扰侵蚀的系统理论主要立足于概率统计。通 过统计规律、概率分布对事物的发展进行预测,对事物的处置进行决策。现有的系统分
析的量化方法,大都是数理统计法如回归分析、方差分析、主成分分析等,回归分析是 应用最广泛的一种办法。但回归分析要求大样本,只有通过大量的数据才能得到量化的 规律,这对很多无法得到或一时缺乏数据的实际问题的解决带来困难。回归分析还要求 样本有较好的分布规律,而很多实际情形并非如此。例如,我国建国以来经济方面有几 次大起大落,难以满足样本有较规律的分布要求。因此,有了大量的数据也不一定能得 到统计规律,甚至即使得到了统计规律,也并非任何情况都可以分析。另外,回归分析 不能分析因素间动态的关联程度,即使是静态,其精度也不高,且常常出现反常现象 灰色系统理论提出了一种新的分析方法一关联度分析方法,即根据因素之间发展 态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程 度。由于以发展态势为立足点,因此对样本量的多少没有过分的要求,也不需要典型的 分布规律,计算量少到甚至可用手算,且不致出现关联度的量化结果与定性分析不一致 的情况。这种方法已应用到农业经济、水利、宏观经济等各方面,都取得了较好的效果。 灰色系统理论建模的主要任务是根据具体灰色系统的行为特征数据,充分开发并 利用不多的数据中的显信息和隐信息,寻找因素间或因素本身的数学关系。通常的办法 是采用离散模型,建立一个按时间作逐段分析的模型。但是,离散模型只能对客观系统 的发展做短期分析,适应不了从现在起做较长远的分析、规划、决策的要求。尽管连续 系统的离散近似模型对许多工程应用来讲是有用的,但在某些研究领域中,人们却常常 希望使用微分方程模型。事实上,微分方程的系统描述了我们所希望辨识的系统内部的 物理或化学过程的本质。 灰色系统理论首先基于对客观系统的新的认识。尽管某些系统的信息不够充分, 但作为系统必然是有特定功能和有序的,只是其内在规律并未充分外露。有些随机量、 无规则的干扰成分以及杂乱无章的数据列,从灰色系统的观点看,并不认为是不可捉摸 的。相反地,灰色系统理论将随机量看作是在一定范围内变化的灰色量,按适当的办法 将原始数据进行处理,将灰色数变换为生成数,从生成数进而得到规律性较强的生成函 数。例如,某些系统的数据经处理后呈现出指数规律,这是由于大多数系统都是广义的 能量系统,而指数规律是能量变化的一种规律。灰色系统理论的量化基础是生成数,从 而突破了概率统计的局限性,使其结果不再是过去依据大量数据得到的经验性的统计规 律,而是现实性的生成律。这种使灰色系统变得尽量清晰明了的过程被称为白化。 目前,灰色系统理论已成功地应用于工程控制、经济管理、未来学研究、生态系 统及复杂多变的农业系统中,并取得了可喜的成就。灰色系统理论有可能对社会、经济 等抽象系统进行分析、建模、预测、决策和控制,它有可能成为人们认识客观系统改造 客观系统的一个新型的理论工具。 §2关联分析 大千世界里的客观事物往往现象复杂,因素繁多。我们往往需要对系统进行因素 分析,这些因素中哪些对系统来讲是主要的,哪些是次要的,哪些需要发展,哪些需要 抑制,哪些是潜在的,哪些是明显的。一般来讲,这些都是我们极为关心的问题。事实 上,因素间关联性如何、关联程度如何量化等问题是系统分析的关键和起点。 因素分析的基本方法过去主要采取回归分析等办法。正如前一节指出的,回归分 416-
-416- 析的量化方法,大都是数理统计法如回归分析、方差分析、主成分分析等,回归分析是 应用最广泛的一种办法。但回归分析要求大样本,只有通过大量的数据才能得到量化的 规律,这对很多无法得到或一时缺乏数据的实际问题的解决带来困难。回归分析还要求 样本有较好的分布规律,而很多实际情形并非如此。例如,我国建国以来经济方面有几 次大起大落,难以满足样本有较规律的分布要求。因此,有了大量的数据也不一定能得 到统计规律,甚至即使得到了统计规律,也并非任何情况都可以分析。另外,回归分析 不能分析因素间动态的关联程度,即使是静态,其精度也不高,且常常出现反常现象。 灰色系统理论提出了一种新的分析方法—关联度分析方法,即根据因素之间发展 态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程 度。由于以发展态势为立足点,因此对样本量的多少没有过分的要求,也不需要典型的 分布规律,计算量少到甚至可用手算,且不致出现关联度的量化结果与定性分析不一致 的情况。这种方法已应用到农业经济、水利、宏观经济等各方面,都取得了较好的效果。 灰色系统理论建模的主要任务是根据具体灰色系统的行为特征数据,充分开发并 利用不多的数据中的显信息和隐信息,寻找因素间或因素本身的数学关系。通常的办法 是采用离散模型,建立一个按时间作逐段分析的模型。但是,离散模型只能对客观系统 的发展做短期分析,适应不了从现在起做较长远的分析、规划、决策的要求。尽管连续 系统的离散近似模型对许多工程应用来讲是有用的,但在某些研究领域中,人们却常常 希望使用微分方程模型。事实上,微分方程的系统描述了我们所希望辨识的系统内部的 物理或化学过程的本质。 灰色系统理论首先基于对客观系统的新的认识。尽管某些系统的信息不够充分, 但作为系统必然是有特定功能和有序的,只是其内在规律并未充分外露。有些随机量、 无规则的干扰成分以及杂乱无章的数据列,从灰色系统的观点看,并不认为是不可捉摸 的。相反地,灰色系统理论将随机量看作是在一定范围内变化的灰色量,按适当的办法 将原始数据进行处理,将灰色数变换为生成数,从生成数进而得到规律性较强的生成函 数。例如,某些系统的数据经处理后呈现出指数规律,这是由于大多数系统都是广义的 能量系统,而指数规律是能量变化的一种规律。灰色系统理论的量化基础是生成数,从 而突破了概率统计的局限性,使其结果不再是过去依据大量数据得到的经验性的统计规 律,而是现实性的生成律。这种使灰色系统变得尽量清晰明了的过程被称为白化。 目前,灰色系统理论已成功地应用于工程控制、经济管理、未来学研究、生态系 统及复杂多变的农业系统中,并取得了可喜的成就。灰色系统理论有可能对社会、经济 等抽象系统进行分析、建模、预测、决策和控制,它有可能成为人们认识客观系统改造 客观系统的一个新型的理论工具。 §2 关联分析 大千世界里的客观事物往往现象复杂,因素繁多。我们往往需要对系统进行因素 分析,这些因素中哪些对系统来讲是主要的,哪些是次要的,哪些需要发展,哪些需要 抑制,哪些是潜在的,哪些是明显的。一般来讲,这些都是我们极为关心的问题。事实 上,因素间关联性如何、关联程度如何量化等问题是系统分析的关键和起点。 因素分析的基本方法过去主要采取回归分析等办法。正如前一节指出的,回归分
析的办法有很多欠缺,如要求大量数据、计算量大及可能出现反常情况等。为克服以上 弊病,本节采用关联度分析的办法来做系统分析 作为一个发展变化的系统,关联分析实际上是动态过程发展态势的量化比较分析。 所谓发展态势比较,也就是系统各时期有关统计数据的几何关系的比较。 例如,某地区1977~1983年总收入与养猪、养兔收入资料见表1 表1收入数据 1979 总收入 养猪 12 22 根据表1,做曲线图1。 图1收入数据图 由上图易看出,曲线A与曲线B发展趋势比较接近,而与曲线C相差较大,因此 可以判断,该地区对总收入影响较直接的是养猪业,而不是养兔业。 很显然,几何形状越接近,关联程度也就越大。当然,直观分析对于稍微复杂些 的问题则显得难于进行。因此,需要给出一种计算方法来衡量因素间关联程度的大小。 2.1数据变换技术 为保证建模的质量与系统分析的正确结果,对收集来的原始数据必须进行数据变换 和处理,使其消除量纲和具有可比性。 定义1设有序列 x=(x(1),x(2),…,x(m) 则称映射
-417- 析的办法有很多欠缺,如要求大量数据、计算量大及可能出现反常情况等。为克服以上 弊病,本节采用关联度分析的办法来做系统分析。 作为一个发展变化的系统,关联分析实际上是动态过程发展态势的量化比较分析。 所谓发展态势比较,也就是系统各时期有关统计数据的几何关系的比较。 例如,某地区 1977~1983 年总收入与养猪、养兔收入资料见表 1。 表 1 收入数据 1977 1978 1979 1980 1981 1982 1983 总收入 养 猪 养 兔 18 20 22 40 44 48 60 10 15 16 24 38 40 50 3 2 12 10 22 18 20 根据表 1,做曲线图 1。 1977 1978 1979 1980 1981 1982 1983 0 10 20 30 40 50 60 A B C 图 1 收入数据图 由上图易看出,曲线 A 与曲线 B 发展趋势比较接近,而与曲线 C 相差较大,因此 可以判断,该地区对总收入影响较直接的是养猪业,而不是养兔业。 很显然,几何形状越接近,关联程度也就越大。当然,直观分析对于稍微复杂些 的问题则显得难于进行。因此,需要给出一种计算方法来衡量因素间关联程度的大小。 2.1 数据变换技术 为保证建模的质量与系统分析的正确结果,对收集来的原始数据必须进行数据变换 和处理,使其消除量纲和具有可比性。 定义 1 设有序列 x = (x(1), x(2),", x(n)) 则称映射
f(x(k)=y(k),k=1,2,…,n 为序列x到序列y的数据变换。 x(k) f(x(k)=x((k),x(1)≠0 称∫是初值化变换。 f(x())=x(k) =y(k),x=∑x(k) 称∫是均值化变换。 3)当 f(x(k)=r(k) y(k) max x(k 称∫是百分比变换 f(x)=-(4 nin x()y() (k)≠0 称∫是倍数变换 (k)=x(k) x 其中x0为大于零的某个值,称∫是归一化变换。 418
-418- f x k y k k n f x y ( ( )) ( ), 1,2, , : = = " → 为序列 x 到序列 y 的数据变换。 1)当 ( ), (1) 0 (1) ( ) ( ( )) = = y k x ≠ x x k f x k 称 f 是初值化变换。 2)当 ∑ = = = = n k x k n y k x x x k f x k 1 ( ) 1 ( ), ( ) ( ( )) 称 f 是均值化变换。 3)当 ( ) ( ( )) ( ) max ( ) k x k f xk yk x k = = 称 f 是百分比变换。 4)当 ( ) ( ( )) ( ), min ( ) 0 min ( ) k k x k f xk yk xk x k == ≠ 称 f 是倍数变换。 5)当 ( ) ( ) ( ( )) 0 y k x x k f x k = = 其中 0 x 为大于零的某个值,称 f 是归一化变换。 6)当
x(k)-min x(k) f(x(k)) maxx(k) y(k) 称∫是极差最大值化变换。 x(k)-min x(k) f(x(k) maxx(k)-min x(k)=y(k) 称∫是区间值化变换 22关联分析 定义2选取参考数列 x={x0(k)|k=1,2,…,m}=(x0()2x0(2),…,x(m) 其中k表示时刻。假设有m个比较数列 x={x(k)k=1,2,…,n}=(x、(1)x(2,…,x(m),i=1,2, 则称 min minlo(-x, (0+pmaxmaxro()-x (oI (1) o(k)-x(k)+pmax max]ro()-x( 为比较数列x对参考数列x在k时刻的关联系数,其中P∈[O1为分辨系数。称(1) 式中 min minlo()-x(O)、 max max x()-x()分别为两级最小差及两级最大差 一般来讲,分辨系数ρ越大,分辨率越大;ρ越小,分辨率越小, (1)式定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指 标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于比较,为此我们给 定义3称 5(k) 为数列x对参考数列x的关联度 由(2)易看出,关联度是把各个时刻的关联系数集中为一个平均值,亦即把过于 分散的信息集中处理。利用关联度这个概念,我们可以对各种问题进行因素分析。考虑
-419- ( ) max ( ) ( ) min ( ) ( ( )) y k x k x k x k f x k k k = − = 称 f 是极差最大值化变换。 7)当 ( ) max ( ) min ( ) ( ) min ( ) ( ( )) y k x k x k x k x k f x k k k k = − − = 称 f 是区间值化变换。 2.2 关联分析 定义 2 选取参考数列 { ( ) | 1,2, , } ( (1), (2), , ( )) x0 = x0 k k = " n = x0 x0 " x0 n 其中k 表示时刻。假设有 m 个比较数列 x {x (k) | k 1,2, , n} (x (1), x (2), , x (n)) i = i = " = i i " i ,i = 1,2,",m 则称 ( ) ( ) maxmax ( ) ( ) min min ( ) ( ) maxmax ( ) ( ) ( ) 0 0 0 0 x k x k x t x t x t x t x t x t k s s t i s s t s s t i − + − − + − = ρ ρ ξ (1) 为比较数列 i x 对参考数列 0 x 在 k 时刻的关联系数,其中 ρ ∈[0,1] 为分辨系数。称(1) 式中min min ( ) ( ) 0 x t x t s s t − 、 max max ( ) ( ) 0 x t x t s s t − 分别为两级最小差及两级最大差。 一般来讲,分辨系数 ρ 越大,分辨率越大; ρ 越小,分辨率越小。 (1)式定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指 标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于比较,为此我们给 出 定义 3 称 ∑= = n k i i k n r 1 ( ) 1 ξ (2) 为数列 i x 对参考数列 0 x 的关联度。 由(2)易看出,关联度是把各个时刻的关联系数集中为一个平均值,亦即把过于 分散的信息集中处理。利用关联度这个概念,我们可以对各种问题进行因素分析。考虑
下面的问题 例1通过对某健将级女子铅球运动员的跟踪调査,获得其1982年至1986年每年 最好成绩及16项专项素质和身体素质的时间序列资料,见表2,试对此铅球运动员的 专项成绩进行因素分析。 表2各项成绩数据 1982 铅球专项成绩x0 13.6 14.01 14.54 1564 4kg前抛x 11.50 13.00 15.15 15.30 4kg后抛 16.36 1690 16.56 17.30 4kg原地 13.46 立定跳远x 2.48 2.49 2.56 2.64 2.59 85 x 100 105 推 3kg前抛 12.80 1640 1705 3kg后抛 15.30 18.40 18.75 1795 19.30 3kg原地 12.71 14.66 15.70 3kg滑步 14.78 15.54 1603 定三级跳远x 7.64 56 754 7.70 140 95 0米起跑 4”2 4”25 3”99 100米 13”1 13”42 12”85 12”72 12”56 在利用(1)式及(2)式计算关联度之前,我们需对表2的各个数列做初始化处 理。一般来讲,实际问题中的不同数列往往具有不同的量纲,而我们在计算关联系数时, 要求量纲要相同。因此,需首先对各种数据进行无量纲化。另外,为了易于比较,要求 所有数列有公共的交点。为了解决上述两个问题,我们对给定数列进行变换 定义4给定数列x=(x(1),x(2)…,x(m),称
-420- 下面的问题。 例 1 通过对某健将级女子铅球运动员的跟踪调查,获得其 1982 年至 1986 年每年 最好成绩及 16 项专项素质和身体素质的时间序列资料,见表 2,试对此铅球运动员的 专项成绩进行因素分析。 表 2 各项成绩数据 1982 1983 1984 1985 1986 铅球专项成绩 0 x 13.6 14.01 14.54 15.64 15.69 4kg 前抛 1 x 11.50 13.00 15.15 15.30 15.02 4kg 后抛 2 x 13.76 16.36 16.90 16.56 17.30 4kg 原地 3 x 12.41 12.70 13.96 14.04 13.46 立定跳远 4 x 2.48 2.49 2.56 2.64 2.59 高 翻 5 x 85 85 90 100 105 抓 举 6 x 55 65 75 80 80 卧 推 7 x 65 70 75 85 90 3kg 前抛 8 x 12.80 15.30 16.24 16.40 17.05 3kg 后抛 9 x 15.30 18.40 18.75 17.95 19.30 3kg 原地 10 x 12.71 14.50 14.66 15.88 15.70 3kg 滑步 11 x 14.78 15.54 16.03 16.87 17.82 立定三级跳远 12 x 7.64 7.56 7.76 7.54 7.70 全 蹲 13 x 120 125 130 140 140 挺 举 14 x 80 85 90 90 95 30 米起跑 15 x 4’’2 4’’25 4’’1 4’’06 3’’99 100 米 16 x 13’’1 13’’42 12’’85 12’’72 12’’56 在利用(1)式及(2)式计算关联度之前,我们需对表 2 的各个数列做初始化处 理。一般来讲,实际问题中的不同数列往往具有不同的量纲,而我们在计算关联系数时, 要求量纲要相同。因此,需首先对各种数据进行无量纲化。另外,为了易于比较,要求 所有数列有公共的交点。为了解决上述两个问题,我们对给定数列进行变换。 定义 4 给定数列 x = (x(1), x(2),", x(n)) ,称
n x(1)x(1) 为原始数列X的初始化数列。 这样,我们可对表2中的17个数列进行初始化处理。注意,对于前15个数列, 随着时间的增加,数值的增加意味着运动水平的进步,而对后2个数列来讲,随着时间 的增加,数值(秒数)的减少却意味着运动水平的进步。因此,在对数列xs及x进 行初始化处理时,采取以下公式 =/()x(x()x(① x(2)x1(3)x1(4)x(5) ,i=15,16 依照问题的要求,我们自然选取铅球运动员专项成绩作为参考数列,将表2中的 各个数列的初始化数列代入(1)及(2)式,易算出各数列的关联度如下表(这里 p=0.5)。 表3关联度计算结果 F 0.588 0.663 0.854 0.776 0.502 0.659 0.582 /12 /13 0.696 0.705 0.933 0.847 0.745 0.726 计算的 MATLAB程序如下: clc. clear load x. txt%把原始数据存放在纯文本文件xtxt中 x(i,)=x(n:)/x(i,1),%标准化数据 fori=16:17 x(i,)=x(,1)x(G,),%标准化数据 data=x: n =size(data, 1) ck=data(1, ) mI=size(ck, 1) bj=data(2: n, ) m2=size(bj, 1); for F=l m1 t(, )=bj(, )-ck(i, ):
-421- ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = (1) ( ) , , (1) (2) 1, x x n x x x " 为原始数列 X 的初始化数列。 这样,我们可对表 2 中的 17 个数列进行初始化处理。注意,对于前 15 个数列, 随着时间的增加,数值的增加意味着运动水平的进步,而对后 2 个数列来讲,随着时间 的增加,数值(秒数)的减少却意味着运动水平的进步。因此,在对数列 15 x 及 16 x 进 行初始化处理时,采取以下公式 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = (5) (1) , (4) (1) , (3) (1) , (2) (1) 1, i i i i i i i i i x x x x x x x x x ,i = 15,16 依照问题的要求,我们自然选取铅球运动员专项成绩作为参考数列,将表 2 中的 各个数列的初始化数列代入(1)及(2)式,易算出各数列的关联度如下表(这里 ρ = 0.5 )。 表 3 关联度计算结果 1r 2r 3r 4r 5r 6r 7r 8r 0.588 0.663 0.854 0.776 0.855 0.502 0.659 0.582 9r 10 r 11 r 12 r 13 r 14 r 15 r 16 r 0.683 0.696 0.896 0.705 0.933 0.847 0.745 0.726 计算的 MATLAB 程序如下: clc,clear load x.txt %把原始数据存放在纯文本文件 x.txt 中 for i=1:15 x(i,:)=x(i,:)/x(i,1); %标准化数据 end for i=16:17 x(i,:)=x(i,1)./x(i,:); %标准化数据 end data=x; n=size(data,1); ck=data(1,:);m1=size(ck,1); bj=data(2:n,:);m2=size(bj,1); for i=1:m1 for j=1:m2 t(j,:)=bj(j,:)-ck(i,:);
jcl=min(min(abs(t))):jc2=max(max(abs(t)) rho=0.5 ksiFGcl+rho*jc2).( abs(t)+rho"jc2 rt=sum(ksi")size(ksi, 2) [ rs rind]=sor(r; descend')%对关联度进行排序 由表3易看出,影响铅球专项成绩的前八项主要因素依次为全蹲、3kg滑步、高翻 4kg原地、挺举、立定跳远、30米起跳、100米成绩。因此,在训练中应着重考虑安排 这八项指标的练习。这样可减少训练的盲目性,提高训练效果 应该指出的是,公式(1)中的|x0(k)-x,(k)不能区别因素关联是正关联还是负 关联,可采取下述办法解决这个问题。记 -(-,(=12…m 则: (1)当sign(G)=sign(a,),则x和x,为正关联; (2)当sign(a,)=-gn(1),则x和x为负关联 §3优势分析 当参考数列不止一个,被比较的因素也不止一个时,则需进行优势分析 假设有m个参考数列(宜称母因素),记为y1,y2…yn,再假设有个比较数列(亦 称子因素),记为x1,x2,…,x。显然,每一个参考数列对l个比较数列有/个关联度, 设表示比较数列x,对参考数列y的关联度,可构造关联(度)矩阵R=()m。根 据矩阵R的各个元素的大小,可分析判断出哪些因素起主要影响,哪些因素起次要影 响。起主要影响的因素称之为优势因素。再进一步,当某一列元素大于其它列元素时 称此列所对应的子因素为优势子因素;若某一行元素均大于其它行元素时,称此行所对 应的母元素为优势母元素。例如,矩阵R的第3列元素大于其它各列元素, 3>,i=l12,…,m;j≠3
-422- end jc1=min(min(abs(t')));jc2=max(max(abs(t'))); rho=0.5; ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2); rt=sum(ksi')/size(ksi,2); r(i,:)=rt; end r [rs,rind]=sort(r,'descend') %对关联度进行排序 由表 3 易看出,影响铅球专项成绩的前八项主要因素依次为全蹲、3kg 滑步、高翻、 4kg 原地、挺举、立定跳远、30 米起跳、100 米成绩。因此,在训练中应着重考虑安排 这八项指标的练习。这样可减少训练的盲目性,提高训练效果。 应该指出的是,公式(1)中的| ( ) ( ) | 0 x k x k − i 不能区别因素关联是正关联还是负 关联,可采取下述办法解决这个问题。记 ∑ ∑ ∑ = = = = − n k n k i n k i i n k kx k x k 1 1 1 σ ( ) ( ) ,i = 1,2,", n 则: (1)当sign( ) sign( ) σ i = σ j ,则 i x 和 j x 为正关联; (2)当sign( ) sign( ) σ i = − σ j ,则 i x 和 j x 为负关联。 §3 优势分析 当参考数列不止一个,被比较的因素也不止一个时,则需进行优势分析。 假设有 m 个参考数列(宜称母因素),记为 m y , y , , y 1 2 " ,再假设有l 个比较数列(亦 称子因素),记为 l x , x , , x 1 2 " 。显然,每一个参考数列对l 个比较数列有l 个关联度, 设 ij r 表示比较数列 j x 对参考数列 i y 的关联度,可构造关联(度)矩阵 ij m l R r = × ( ) 。根 据矩阵 R 的各个元素的大小,可分析判断出哪些因素起主要影响,哪些因素起次要影 响。起主要影响的因素称之为优势因素。再进一步,当某一列元素大于其它列元素时, 称此列所对应的子因素为优势子因素;若某一行元素均大于其它行元素时,称此行所对 应的母元素为优势母元素。例如,矩阵 R 的第 3 列元素大于其它各列元素, i ij r > r 3 ,i = 1,2,",m; j ≠ 3
则称x3为优势子因素。 如果矩阵R的某个元素达到最大,则该行对应的母因素被认为是所有母因素中影 响最大的。 为简单起见,先来讨论一下“对角线”以上元素为零的关联矩阵,例如 0.800000 0.60.500 00 0 R=0.7070.30 0 040.60.70.900 0.3080.2070.5040 因为第1列元素是满的,故称第1个子元素为潜在优势子因素。第2列元素中有一个元 素为零,故称第2个子因素为次潜在优势子因素。余下类推。 当关联矩阵的“对角线”以下全都是零元素,则称第1个母因素为潜在优势母因 素……,为了分析方便,我们经常把相对较小的元素近似为零,从而使关联矩阵尽量稀 我们参考一个实际问题。 例2某地区有6个母因素y1(i=12,…6),5个子因素x(j=1,2,…5)如 x:固定资产投资 y:国民收入 x2:工业投资 y2:工业收入 x3:农业投资 y3:农业收入 x4:科技投资 y4:商业收入 x5:交通投资 y5:交通收入 y6:建筑业收入 其数据列于表4。 表4投资和收入数据 1979 1980 1981 308.58 310 346 367 1954 1899 187.2 22.7
-423- 则称 3 x 为优势子因素。 如果矩阵 R 的某个元素达到最大,则该行对应的母因素被认为是所有母因素中影 响最大的。 为简单起见,先来讨论一下“对角线”以上元素为零的关联矩阵,例如 ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = 0.3 0.8 0.2 0.7 0.504 0 0.4 0.6 0.7 0.9 0 0 0.7 0.7 0.3 0 0 0 0.6 0.5 0 0 0 0 0.8 0 0 0 0 0 R 因为第 1 列元素是满的,故称第 1 个子元素为潜在优势子因素。第 2 列元素中有一个元 素为零,故称第 2 个子因素为次潜在优势子因素。余下类推。 当关联矩阵的“对角线”以下全都是零元素,则称第 1 个母因素为潜在优势母因 素……,为了分析方便,我们经常把相对较小的元素近似为零,从而使关联矩阵尽量稀 疏。 我们参考一个实际问题。 例 2 某地区有 6 个母因素 i y (i = 1,2,",6 ),5 个子因素 j x ( j =1,2,",5)如 下: 1 x :固定资产投资 1 y :国民收入 2 x :工业投资 2 y :工业收入 3 x :农业投资 3 y :农业收入 4 x :科技投资 4 y :商业收入 5 x :交通投资 5 y :交通收入 6 y :建筑业收入 其数据列于表 4。 表 4 投资和收入数据 1979 1980 1981 1982 1983 1 x 308.58 310 295 346 367 2 x 195.4 189.9 187.2 205 222.7
24.6 12.2 27655 174 216.4 235.8 57.55 70.74 76.8 80.7 89.85 85.38 9983 103.4 y 11.19 13.28 16.82 22.8 4.34 5.06 5.78 13.7 15.6 13.77 1198 根据表4的数据,利用如下的 MATLAB程序 load data. txt%把原始数据存放在纯文本文件 data. txt中 data(i,)=data(i: )data(i,1);%标准化数据 bj=data( 1: 5, ) m2=size(bj, 1); for =1: m2 -)=bj(,)-ck(1-) jcl=min(min(abs(t))):jc2=max(max(abs(t)); ksi=gcl+rho*jc2)./(abs(t)+rho*jc2); 计算出各个子因素对母因素的关联度(这里取p=0.5),从而得到关联矩阵为 424
-424- 3 x 24.6 21 12.2 15.1 14.57 4 x 20 25.6 23.3 29.2 30 5 x 18.98 19 22.3 23.5 27.655 1 y 170 174 197 216.4 235.8 2 y 57.55 70.74 76.8 80.7 89.85 3 y 88.56 70 85.38 99.83 103.4 4 y 11.19 13.28 16.82 18.9 22.8 5 y 4.03 4.26 4.34 5.06 5.78 6 y 13.7 15.6 13.77 11.98 13.95 根据表 4 的数据,利用如下的 MATLAB 程序 clc,clear load data.txt %把原始数据存放在纯文本文件 data.txt 中 n=size(data,1); for i=1:n data(i,:)=data(i,:)/data(i,1); %标准化数据 end ck=data(6:n,:);m1=size(ck,1); bj=data(1:5,:);m2=size(bj,1); for i=1:m1 for j=1:m2 t(j,:)=bj(j,:)-ck(i,:); end jc1=min(min(abs(t')));jc2=max(max(abs(t'))); rho=0.5; ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2); rt=sum(ksi')/size(ksi,2); r(i,:)=rt; end r 计算出各个子因素对母因素的关联度(这里取 ρ = 0.5 ),从而得到关联矩阵为