绪言 任何新生事物的产生和发展,都要经过一个由弱到强,逐步成长壮大的过程, 一种新理论、一种新学科的问世,往往一开始会受到许多人的怀疑甚至否定。模 糊数学自1965年L.A. Zadeh教授开创以来所走过的道路,充分证实了这一点, 然而,实践是检验真理的标准,模糊数学在理论和实际应用两方面同时取得的巨 大成果,不仅消除了人们的疑虑,而且使模糊数学在科学领域中,占有了自己的 席之地。 经典数学是适应力学、天文、物理、化学这类学科的需要而发展起来的,不 可能不带有这些学科固有的局限性。这些学科考察的对象,都是无生命的机械系 统,大都是界限分明的清晰事物,允许人们作出非此即彼的判断,进行精确的测 量,因而适于用精确方法描述和处理。而那些难以用经典数学实现定量化的学科 特别是有关生命现象、社会现象的学科,研究的对象大多是没有明确界限的模糊 事物,不允许作出非此即彼的断言,不能进行精确的测量。清晰事物的有关参量 可以精确测定,能够建立起精确的数学模型。模糊事物无法获得必要的精确数据 不能按精确方法建立数学模型。实践证明,对于不同质的矛盾,只有用不同质的 方法才能解决。传统方法用于力学系统高度有效,但用于对人类行为起重要作用 的系统,就显得太精确了,以致于很难达到甚至无法达到 精确方法的逻辑基础是传统的二值逻辑,即要求符合非此即彼的排中律,这 对于处理清晰事物是适用的。但用于处理模糊性事物时,就会产生逻辑悖论。如 判断企业经济效益的好坏时,用“年利税在100万元以上者为经济效益好的企业” 表达,否则,便是经济效益不好的企业。根据常识,显而易见:“比经济效益好 的企业年利税少1元的企业,仍是经济效益好的企业”,而不应被划为经济效益 不好的企业。这样,从上面的两个结论出发,反复运用经典的二值逻辑,我们最 后就会得到,“年利税为0者仍为经济效益好的企业”的悖论。类似的悖论有许 多,历史上最著名的有“罗素悖论”。它们都是在用二值逻辑来处理模糊性事物 时产生的。 客观实际中存在众多的模糊性事物和现象,促使人们寻求建立一种适于描述 模糊事物和现象的逻辑模式。模糊集合理论便是在这种形势下应运而生的。模糊 方法的逻辑基础是连续值逻辑,它是建立在[0,1]上的。如若我们把年利税在 100万元以上者的属于“经济效益好”的企业的隶属度规定为1,那末,相比之 下,年利税少1元的企业,属于“经济效益好”的企业的隶属度就应相应减少一
绪言 任何新生事物的产生和发展,都要经过一个由弱到强,逐步成长壮大的过程, 一种新理论、一种新学科的问世,往往一开始会受到许多人的怀疑甚至否定。模 糊数学自 1965 年 L.A.Zadeh 教授开创以来所走过的道路,充分证实了这一点, 然而,实践是检验真理的标准,模糊数学在理论和实际应用两方面同时取得的巨 大成果,不仅消除了人们的疑虑,而且使模糊数学在科学领域中,占有了自己的 一席之地。 经典数学是适应力学、天文、物理、化学这类学科的需要而发展起来的,不 可能不带有这些学科固有的局限性。这些学科考察的对象,都是无生命的机械系 统,大都是界限分明的清晰事物,允许人们作出非此即彼的判断,进行精确的测 量,因而适于用精确方法描述和处理。而那些难以用经典数学实现定量化的学科, 特别是有关生命现象、社会现象的学科,研究的对象大多是没有明确界限的模糊 事物,不允许作出非此即彼的断言,不能进行精确的测量。清晰事物的有关参量 可以精确测定,能够建立起精确的数学模型。模糊事物无法获得必要的精确数据, 不能按精确方法建立数学模型。实践证明,对于不同质的矛盾,只有用不同质的 方法才能解决。传统方法用于力学系统高度有效,但用于对人类行为起重要作用 的系统,就显得太精确了,以致于很难达到甚至无法达到。 精确方法的逻辑基础是传统的二值逻辑,即要求符合非此即彼的排中律,这 对于处理清晰事物是适用的。但用于处理模糊性事物时,就会产生逻辑悖论。如 判断企业经济效益的好坏时,用“年利税在 100 万元以上者为经济效益好的企业” 表达,否则,便是经济效益不好的企业。根据常识,显而易见:“比经济效益好 的企业年利税少 1 元的企业,仍是经济效益好的企业”,而不应被划为经济效益 不好的企业。这样,从上面的两个结论出发,反复运用经典的二值逻辑,我们最 后就会得到,“年利税为 0 者仍为经济效益好的企业”的悖论。类似的悖论有许 多,历史上最著名的有“罗素悖论”。它们都是在用二值逻辑来处理模糊性事物 时产生的。 客观实际中存在众多的模糊性事物和现象,促使人们寻求建立一种适于描述 模糊事物和现象的逻辑模式。模糊集合理论便是在这种形势下应运而生的。模糊 方法的逻辑基础是连续值逻辑,它是建立在[0,1]上的。如若我们把年利税在 100 万元以上者的属于“经济效益好”的企业的隶属度规定为 1,那末,相比之 下,年利税少 1 元的企业,属于“经济效益好”的企业的隶属度就应相应减少一
点,比如为0.9999,依此类推,企业的年利税每减少1元,它属于“经济效益 好”的企业的隶属度就要相应减少一点。这样下去,当企业的年利税为0时,它 属于“经济效益好”的企业的隶属度也就为0了,显然,模糊方法的这种处理方 式,是符合于人们的认识过程的,连续值逻辑是二值逻辑的合理推广。 现代科学发展的总趋势是,从以分析为主对确定性现象的研究,进到以综合 为主对不确定性现象的研究。各门科学在充分研究本领域中那些非此即彼的典型 现象之后,正在扩大视域,转而研究那些亦此亦彼的非典型现象。自然科学不同 学科之间,社会科学不同学科之间,自然科学和社会科学之间,相互渗透的趋势 日益加强,原来截然分明的学科界限一个个被打破,边缘科学大量涌现出来。随 着科学技术的综合化、整体化,边界不分明的对象,亦即模糊性对象,以多种多 样的形式普遍地、经常地出现在科学的前沿 模糊集合理论自诞生以来,获得了长足的发展,每年全世界发表的研究论文 的数量,以指数级速度増长。硏究范围从开始时的模糊集合,发展为模糊数、模 糊代数、模糊测度、模糊积分、模糊规划、模糊图论、模糊拓扑…等众多的分 枝 和模糊集合理论的发展速度相比,模糊技术的应用虽稍迟一步,但也取得了 令人可喜的进展。自1980年第一例应用模糊技术的产品问世以来,有关这方面 的硏究报告已逾τ000多篇,制造出近千种模糊产品,如计算机、电饭煲、摄像 机、微波炉、洗衣机、空调器等。如日本松下公司硏制的智能化家用空调器,可 根据内置的传感器提供的室内空气温度数据,在室温高或低于25℃时,会自动 地“稍稍”调节空调器的阀门,进行4608种不同状态设定选择,从而获得最佳 开启状态和尽可能少的消耗。而这种“稍稍”的程度,只有通过有经验的人的感 觉来决定 模糊技术方法不是对精确的摒弃,而是对精确更圆满的刻画。它通过模糊控 制规划,利用人类常识和智慧,理解词语的模糊内涵和外延,将各方面专家的思 维互相补充。虽然,目前要使模糊技术接近于人的思维,尚难以做到,但正如日 本夏普公司电子专家日吉考庄所说:一个普遍应用模糊技术的时代,不久就会到 来 我国自70年代开始模糊数学研究以来,成就突出,已形成了2000至3000 人的世界最庞大的硏究队伍,并在髙速模糊推理硏究等领域,居世界领先地位。 但同时在其它方面,也存在着一些差距,尤其突出的是实验室里的成果,还有许
点,比如为 0.99999,依此类推,企业的年利税每减少 1 元,它属于“经济效益 好”的企业的隶属度就要相应减少一点。这样下去,当企业的年利税为 0 时,它 属于“经济效益好”的企业的隶属度也就为 0 了,显然,模糊方法的这种处理方 式,是符合于人们的认识过程的,连续值逻辑是二值逻辑的合理推广。 现代科学发展的总趋势是,从以分析为主对确定性现象的研究,进到以综合 为主对不确定性现象的研究。各门科学在充分研究本领域中那些非此即彼的典型 现象之后,正在扩大视域,转而研究那些亦此亦彼的非典型现象。自然科学不同 学科之间,社会科学不同学科之间,自然科学和社会科学之间,相互渗透的趋势 日益加强,原来截然分明的学科界限一个个被打破,边缘科学大量涌现出来。随 着科学技术的综合化、整体化,边界不分明的对象,亦即模糊性对象,以多种多 样的形式普遍地、经常地出现在科学的前沿。 模糊集合理论自诞生以来,获得了长足的发展,每年全世界发表的研究论文 的数量,以指数级速度增长。研究范围从开始时的模糊集合,发展为模糊数、模 糊代数、模糊测度、模糊积分、模糊规划、模糊图论、模糊拓扑……等众多的分 枝。 和模糊集合理论的发展速度相比,模糊技术的应用虽稍迟一步,但也取得了 令人可喜的进展。自 1980 年第一例应用模糊技术的产品问世以来,有关这方面 的研究报告已逾 7000 多篇,制造出近千种模糊产品,如计算机、电饭煲、摄像 机、微波炉、洗衣机、空调器等。如日本松下公司研制的智能化家用空调器,可 根据内置的传感器提供的室内空气温度数据,在室温高或低于 25℃时,会自动 地“稍稍”调节空调器的阀门,进行 4608 种不同状态设定选择,从而获得最佳 开启状态和尽可能少的消耗。而这种“稍稍”的程度,只有通过有经验的人的感 觉来决定。 模糊技术方法不是对精确的摒弃,而是对精确更圆满的刻画。它通过模糊控 制规划,利用人类常识和智慧,理解词语的模糊内涵和外延,将各方面专家的思 维互相补充。虽然,目前要使模糊技术接近于人的思维,尚难以做到,但正如日 本夏普公司电子专家日吉考庄所说:一个普遍应用模糊技术的时代,不久就会到 来。 我国自 70 年代开始模糊数学研究以来,成就突出,已形成了 2000 至 3000 人的世界最庞大的研究队伍,并在高速模糊推理研究等领域,居世界领先地位。 但同时在其它方面,也存在着一些差距,尤其突出的是实验室里的成果,还有许
多未转化成经济效益。需要在政府和工业界的支持和参与下,成立专门的开发实 体,制定规划,并积极开展国际交流,为我国21世纪的技术发展和科学腾飞奠 定基础。 第二章模式识别 §2-1模式识别及识别的直接方法 在日常生活中生活中,经常需要进行各种判断、预测。如图象文字识 别、故障(疾病)的诊断、矿藏情况的判断等,其特点就是在已知各种标 准类型前提下,判断识别对象属于哪个类型的问题。这样的问题就是模式 识别 、模糊模式识别的一般步骤 模式识别的问题,在模糊数学形成之前就已经存在,传统的作法主要 用统计方法或语言的方法进行识别。但在多数情况下,标准类型常可用模 糊集表示,用模糊数学的方法进行识别是更为合理可行的,以模糊数学为 基础的模式识别方法称为模糊模式识别。 模式识别主要包括三个步骤 第一步:提取特征,首先需要从识别对象中提取与识别有关的特征, 并度量这些特征,设x12…,xn分别为每个特征的度量值,于是每个识别对 象x就对应一个向量(x1,x2,…,xn),这一步是识别的关键,特征提取不合理, 会影响识别效果。 第二步:建立标准类型的隶属函数,标准类型通常是论域 U=(x1…xn)}的模糊集,x是识别对象的第i个特征 第三步:建立识别判决准则,确定某些归属原则,以判定识别对象属 于哪一个标准类型。常用的判决准则有最大隶属度原则(直接法)和择近 原则(间接法)两种 二、最大的隶属度原则 若标准类型是一些表示模糊概念的模糊集,待识别对象是论域中的某 一元素(个体)时,往往由于识别对象不绝对地属于某类标准类型,因而 隶属度不为1,这类问题人们常常是采用称为“最大隶属度原则”的方法 加以识别,这种方法(以及下面的“阈值原则”)是处理个体识别问题的 称为直接法。 最大隶属度原则:设A,A2…An∈F(U)是n个标准类型,x0∈U,若 A(x)-mx{A(x)1≤k≤n}
多未转化成经济效益。需要在政府和工业界的支持和参与下,成立专门的开发实 体,制定规划,并积极开展国际交流,为我国 21 世纪的技术发展和科学腾飞奠 定基础。 第二章 模式识 别 §2 -1 模 式 识 别 及 识 别 的 直 接 方 法 在 日 常 生 活 中 生 活 中 ,经 常 需 要 进 行 各 种 判 断 、预 测 。如 图 象 文 字 识 别 、故 障( 疾 病 )的 诊 断 、矿 藏 情 况 的 判 断 等 ,其 特 点 就 是 在 已 知 各 种 标 准 类 型 前 提 下 ,判 断 识 别 对 象 属 于 哪 个 类 型 的 问 题 。这 样 的 问 题 就 是 模 式 识别。 一 、 模 糊 模 式 识 别 的 一 般 步 骤 模 式 识 别 的 问 题 , 在 模 糊 数 学 形 成 之 前 就 已 经 存 在 ,传 统 的 作 法 主 要 用 统 计 方 法 或 语 言 的 方 法 进 行 识 别 。但 在 多 数 情 况 下 ,标 准 类 型 常 可 用 模 糊 集 表 示 ,用 模 糊 数 学 的 方 法 进 行 识 别 是 更 为 合 理 可 行 的 ,以 模 糊 数 学 为 基 础 的 模 式 识 别 方 法 称 为 模 糊 模 式 识 别 。 模式识别主要 包 括 三 个 步 骤 : 第 一 步 : 提 取 特 征 , 首 先 需 要 从 识 别 对 象 中 提 取 与 识 别 有 关 的 特 征 , 并 度 量 这 些 特 征 , 设 n x , , x 1 分 别 为 每 个 特 征 的 度 量 值 , 于 是 每 个 识 别 对 象 x 就 对 应 一 个 向 量 ( , , , ) 1 2 n x x x ,这 一 步 是 识 别 的 关 键 ,特 征 提 取 不 合 理 , 会 影 响 识 别 效 果 。 第 二 步 : 建 立 标 准 类 型 的 隶 属 函 数 , 标 准 类 型 通 常 是 论 域 U = (x1 , xn ) 的模糊集, i x 是 识 别 对 象 的 第 i 个 特 征 。 第 三 步 :建 立 识 别 判 决 准 则 , 确 定 某 些 归 属 原 则 , 以 判 定 识 别 对 象 属 于 哪 一 个 标 准 类 型 。常 用 的 判 决 准 则 有 最 大 隶 属 度 原 则( 直 接 法 )和 择 近 原 则 ( 间 接 法 ) 两 种 。 二、最大的隶属度原则 若 标 准 类 型 是 一 些 表 示 模 糊 概 念 的 模 糊 集 ,待 识 别 对 象 是 论 域 中 的 某 一 元 素 ( 个 体 )时 , 往 往 由 于 识 别 对 象 不 绝 对 地 属 于 某 类 标 准 类 型 , 因 而 隶 属 度 不 为 1, 这 类 问 题 人 们 常 常 是 采 用 称 为 “ 最 大 隶 属 度 原 则 ” 的 方 法 加 以 识 别 , 这 种 方 法( 以 及 下 面 的“ 阈 值 原 则 ”)是 处 理 个 体 识 别 问 题 的 , 称为直接 法 。 最 大 隶 属 度 原 则 : 设 , ( ) A1 A2 An F U 是 n 个 标 准 类 型 , x0 U , 若 Ai (x0 ) − max Ak ( x0 ) 1 k n
则认为x0相对隶属于A所代表的类型 例1通货膨胀识别问题 通货膨胀状态可分成五个类型:通货稳定;轻度通货膨胀;中度通货膨 胀;重度通货膨胀;恶性通货膨胀.以上五个类型依次用R*(非负实数域,下 同)上的模糊集A,A2,A3,A4,A3表示,其隶属函数分别为 1, < A1(x)= p[-[]] x≥5 x-10 A2,(x)=exp(-( 5 x-20 A(x)=exp(-( A4(x)=e(-(+~30 x-50 A5(x) 0≤x<50 15 ≥50 其中对x≥0,表示物价上涨x%。问x=840时,分别相对隶属于哪种 类型? 解1(8)=0.3679,A(8)=0.8521 A3(8)=00529,A4(8)=00032 A5(8)=0.0000 A(40)=0.000,42(40)=0.000 A3(40)=00003,A4(40)=0.1299 A(40)=06412 由最大隶属原则,x=8应相对隶属于A2,即当物价上涨8%时,应视 为轻度通货膨胀;x=40,应相对隶属于A3,即当物价上涨40%时,应视 为恶性通货膨胀。 阈值原则 在使用最大隶属度原则进行识别中,还会出现以下两种情况,其一是
则认为 0 x 相 对 隶 属 于 Ai 所 代 表 的 类 型 。 例 1 通 货 膨 胀 识 别 问 题 通货膨胀状态可分成五个类型 :通 货 稳 定 ;轻度通货膨胀 ;中 度 通 货 膨 胀 ;重度通货膨胀 ;恶性通货膨胀 . 以上五个类型依次用 + R ( 非负实数域 , 下 同 ) 上的模糊集 1 2 3 4 5 A , A , A , A , A 表 示 , 其 隶 属 函 数 分 别 为 : − − = ] ], 5 3 5 exp[ [ 1, 0 5 ( ) 1 2 x x x A x ) ) 5 10 ( ) exp( ( 2 2 − = − x A x ) ) 7 20 ( ) exp( ( 2 3 − = − x A x ) ) 9 30 ( ) exp( ( 2 4 − = − x A x − − = 1, 50 ) ), 0 50 15 50 exp[ ( ( ) 2 5 x x x A x 其中对 x 0 , 表 示 物 价 上 涨 x% 。 问 x = 8,40 时 , 分 别 相 对 隶 属 于 哪 种 类型? 解 A1 (8) = 0.3679, A2 (8) = 0.8521 A3 (8) = 0.0529, A4 (8) = 0.0032 A5 (8) = 0.0000 A1 (40) = 0.0000, A2 (40) = 0.0000 A3 (40) = 0.0003, A4 (40) = 0.1299 A5 (40) = 0.6412 由 最 大 隶 属 原 则 , x = 8 应 相 对 隶 属 于 A2 , 即 当 物 价 上 涨 8% 时 , 应 视 为 轻 度 通 货 膨 胀 ; x = 40 , 应 相 对 隶 属 于 A5 , 即 当 物 价 上 涨 40% 时 , 应 视 为 恶 性 通 货 膨 胀 。 三、阈值原则 在 使 用 最 大 隶 属 度 原 则 进 行 识 别 中 , 还 会 出 现 以 下 两 种 情 况 ,其 一 是
有时待识别对象x关于模糊集A13A2…An中每一个隶属程度都相对较低 这时说明模糊集合A,A2…An对元素x不能识别:其二是有时待识别对象x 关于模糊集A1,A2…A中若干个的隶属程度都相对较高,这时还可以缩小x 的识别范围,关于这两种情况有如下阈值原则 阂值原则:A1,A4…An∈F(U)是n个标准类型,x0∈U,d∈(0,为一阈 值(置信水平)令a=mx({41(x)1≤k≤n 若a<d则不能识别,应查找原因另作分析 若a≥d且有A1(x)2d,A2(x)≥d…4,(x)2d则判决x相对地属 于A1∩42∩…4 例2三角形识别问题 我们把三角形分成等腰三角形I,直角三角形R,正三角形E,非典型 三角形T,这四个标准类型,取定论域 X={xx=(A,BC,A+B+C=180,A≥B≥C 这里A,B,C是三角形三个内角的度数,通过分析建立这四类三角形的 隶属函数为: I(x)=1-[(A-B)A(B-C】州 R(x)=1-1 E(x)=1180(A-C) 7(x)=mn3(A-B)3(B-C,A-C2|4-90 现给定,x=(A,B,C)=(85,50,45),x0对上述四个标准类型的隶属度 (x0)=0.916R(x0)=0.94E(x)=0.7T(x0)=006 由于x关于Ⅰ,R的隶属程度都相对高,故采用阈值原则,取d=0.8 因I(x)=0.916≥0.8,R(x)=0.94≥0.8,按阈值原则,x相对属于∩R 即x可识别为等腰直角三角形
有 时 待 识 别 对 象 0 x 关 于 模 糊 集 A1 A2 An , 中 每 一 个 隶 属 程 度 都 相 对 较 低 , 这 时 说 明 模 糊 集 合 A1 A2 An , 对 元 素 x 不 能 识 别 ;其 二 是 有 时 待 识 别 对 象 x 关 于 模 糊 集 A1 A2 An , 中 若 干 个 的 隶 属 程 度 都 相 对 较 高 ,这 时 还 可 以 缩 小 x 的 识 别 范 围 , 关 于 这 两 种 情 况 有 如 下 阈 值 原 则 。 阈值原则: , ( ) A1 A2 An F U 是 n 个标准类型, , (0,1] x0 U d 为一阈 值 ( 置 信 水 平 ) 令 = max Ak (x0 ) 1 k n 若 d 则 不 能 识 别 , 应 查 找 原 因 另 作 分 析 。 若 d 且 有 Ai (x0 ) d 1 , Ai (x0 ) d 2 … A x d im ( 0 ) 则 判 决 0 x 相 对 地 属 于 i i im A A A 1 2 例 2 三角形识别问题 我 们 把 三 角 形 分 成 等 腰 三 角 形 I ,直 角 三 角 形 R , 正三角形 E , 非典型 三角形 T , 这 四 个 标 准 类 型 ,取 定 论 域 X = x x = (A,B,C), A+ B +C =180, A B C 这 里 A, B,C 是 三 角 形 三 个 内 角 的 度 数 ,通 过 分 析 建 立 这 四 类 三 角 形 的 隶属函数为: [( ) ( )] 60 1 I(x) = 1− A − B B − C ( 2 1 An (x)= 90 90 1 R(x) = 1− A − ( ) 180 1 E(x) = 1− A − C min[ 3( ),3( ), ,2 90 ] 180 1 T(x) = A − B B − C A − C A − 现 给 定 , ( , , ) (85, 50, 45) x0 = A B C = , 0 x 对 上 述 四 个 标 准 类 型 的 隶 属 度 为 : I(x0 ) = 0.916 R(x0 ) = 0.94 E(x0 ) = 0.7 T(x0 ) = 0.06 由 于 0 x 关 于 I , R 的 隶 属 程 度 都 相 对 高 , 故 采 用 阈 值 原 则 , 取 d = 0.8 , 因 I(x0 ) = 0.916 0.8, R(x0 ) = 0.94 0.8 , 按 阈 值 原 则 , 0 x 相对属于 I ∩ R , 即 0 x 可 识 别 为 等 腰 直 角 三 角 形
例3癌细胞识别 在癌细胞识别问题中细胞分成四个标准类型,即;癌细胞(M),重度 核异质细胞(N),轻度核异质细胞(R),正常细胞(T) 选取表征细胞状况的七个特征: x1:核面积 核周长 x2:细胞面积 x4:细胞周长, xs:核内总光密度,x6:核内平均光密度 x:核内平均透光率 根据病理知识,反映细胞是否癌变的主要指标有以下六个,它们都是 ={x:x=(x1,x2…,x)}上的模糊集 A:核增大 B 4x)=(1+22) (a正常核面积) B:核染色增深,B(x)=(1+) C:核桨比例置,C(x)=(1+马2) D核内染色质不匀D()=1+Bx。 (x7+gx6) 核畸形E(x)=1+-B, F:细胞畸形,F(x)=[+ 上述B1B2…B是适当选取的常数 细胞识别中的几个标准类型分别定义为: M=[A∩B∩C∩(DUE)∪F N=A∩B∩C∩M R=A2∩B2∩C2∩M∩N° T=M∩N∩R 上述定义中的模糊集A2的隶属函数为A2(x)=(4(x))2。另两个模糊集B2
例 3 癌细胞识别 在 癌 细 胞 识 别 问 题 中 细 胞 分 成 四 个 标 准 类 型 ,即 :癌 细 胞 (M ) , 重 度 核异质细胞 (N) , 轻 度 核 异 质 细 胞 (R) , 正 常 细 胞 (T )。 选 取 表 征 细 胞 状 况 的 七 个 特 征 : : . : , : , : , : , : , : , 7 5 6 2 4 1 2 核内平均透光率 核内总光密度 核内平均光密度 细胞面积 细胞周长 核面积 核周长 x x x x x x x 根 据 病 理 知 识 ,反 映 细 胞 是 否 癌 变 的 主 要 指 标 有 以 下 六 个 ,它 们 都 是 X = x : x = (x1 , x2 , , x7 ) 上的模糊集: 1 2 3 2 4 6 1 2 1 2 2 5 1 2 7 6 2 4 7 1 2 1 3 1 2 5 2 1 2 1 2 1 ] ( 4 ) : , ( ) [1 ] ( 4 ) : , ( ) [1 ] ( lg ) : , ( ) [1 : , ( ) (1 ) : , ( ) (1 ) : ( ) (1 ) ( ) − − − − − − − = + − = + + = + = + = + = + x x F F x x x E E x x x x D D x x C C x x B B x a x a A A x 细胞畸形 核畸形 核内染色质不匀 核桨比例置 核染色增深 核增大 正常核面积 上 述 1 2 6 , , , 是 适当选取的常数 细 胞 识 别 中 的 几 个 标 准 类 型 分 别 定 义 为 : c c c c c c T M N R R A B C M N N A B C M M A B C D E F = = = = 2 1 2 1 2 1 [ ( )] 上 述 定 义 中 的 模 糊 集 2 1 A 的隶属函数为 2 1 A 2 1 (x) = ( A(x) ) 。另两个模糊集 2 1 B
2的隶属函数类似定义。 给定待识别细胞x∈X,设x0的核面积等七个特征值为(x0,x20,…x,)据此可算出 M(x)、N(x)、R(x0)、T(x0),最后按最大隶属度原则识别 例4冬季降雪量预报 内蒙古丰镇地区流行三条谚语:(1)夏热冬雪大,(2)秋霜晚冬雪大,(3)秋分刮西 北风冬雪大,现在根据三条谚语来预报丰镇地区冬季降雪量。 为描述“夏热”(A)、秋霜晚(A2)、秋分刮西北风(A3)等概念,在气 象现象中提取以下特征 x,:当年6~7月平均气温 x2:当年秋季初霜日期 x3:当年秋分日的风向与正西方向的夹角。 于是模糊集A1(夏热),A2(秋霜晚)、A3(秋分刮西北风)的隶属函数可分 别定义为: x1≥x A(x1)={1-2(x1-x1) x1-√2o1 <x1<x1 其中x1是丰镇地区若干年6、7月份气温的平均值,G1为方差,实际预报时取 x=19c,2σ;=0.98 A a2<x2<x2 其中x2是若干年秋季初霜日的平均值,a,是经验参数,实际预报时取x2=17(即9 月17日),a2=10(即9月10日)
2 1 C 的隶属函数类似定义。 给定待识别细胞 x0 X ,设 0 x 的核面积等七个特征值为 ( , , ) 0 7 0 2 0 1 x x x 据此可算出 ( ) 0 M x 、 ( ) 0 N x 、 ( ) 0 R x 、 ( ) 0 T x ,最后按最大隶属度原则识别。 例 4 冬季降雪量预报 内蒙古丰镇地区流行三条谚语:(1)夏热冬雪大,(2)秋霜晚冬雪大,(3)秋分刮西 北风冬雪大,现在根据三条谚语来预报丰镇地区冬季降雪量。 为描述“夏热” ( ) A1 、秋霜晚 ( ) A2 、 秋 分 刮 西 北 风 ( ) A3 等概念,在气 象 现 象 中 提 取 以 下 特 征 : 1 x :当年 6~7 月平均气温 2 x :当年秋季初霜日期 3 x :当年秋分日的风向与正西方向的夹角。 于是模糊集 A1 (夏热), A2 (秋霜晚)、 A3 (秋 分 刮 西 北 风 )的 隶 属 函 数 可 分 别定义为: − − − − = 0 2 ( ) 2 2 1 1 1 ( ) 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 x x x x x x x x x A x 其 中 1 x 是丰镇地区若干年 6、7 月份气温的平均值, 1 为方差,实际预报时取 x =19 c, 2 2 1 =0.98 − − = 2 2 2 2 2 2 2 2 2 2 2 2 2 0 1 ( ) x a a x x x a x a x x A x 其 中 x 2 是若干年秋季初霜日的平均值, 2 a 是经验参数,实际预报时取 x 2 =17(即 9 月 17 日), 2 a =10(即 9 月 10 日)
SInX 1800<x3<270° A3(x3)= 90°≤x3≤180 0°<x2<90° 取论域X={x|x=(x1,x2,x3)},“冬雪大”可以表示为论域X上的模糊集 C,其隶属函数为 C(x)=A1(x1)∧(A2(x2)VA3(x3) 采用阈值原则,取阈值d=0.8,测定当年气候因子x=(x1,x2,x3)。 算C(x),若C(x)≥0.8则预报当年冬季“多雪”,否则预报“少雪” 用这一方法对丰镇1959~1970年间隔12年作了预报,除1965年以外 均报对,历史拟合率为11/12。 §2-2贴近度与模式识别的间接方法 贴近度 表示两个模糊集接近程度的数量指标,称为贴近度,其严格的数学定 义如下 定义1设映射 N:F()×F(U)→[0,1 满足下列条件: (1)VA∈F(U),N(A,A) (2) VA,BEFO, N(A, B)=N(B, A (3)若A,B,C∈F(U)满足 4(x)-C(x)24(x)-B(x) x∈ 有N(AC)≤N(A 则称映射N为F(U)上的贴近度,称N(AB)为A与B的贴近度 贴近度的具体形式较多,以下介绍几种常见的贴近度公式
= cosx 0 90 0 90 180 -sinx 180 270 1 270 360 ( ) 3 3 3 3 3 3 3 3 x x x x A x 取论域 X = x | x = (x1 , x2 , x3 ) ,“ 冬 雪 大 ” 可 以 表 示 为 论 域 X 上的模糊集 C ,其隶属函数为: ( ) ( ) 1 1 C x = A x ∧ ( ( ) 2 2 A x ∨ ( )) 3 3 A x 采 用 阈 值 原 则 , 取 阈 值 d = 0.8 , 测 定 当 年 气 候 因 子 ( , , ) 1 2 3 x = x x x 。 计 算 C(x) , 若 C(x) 0.8 则 预 报 当 年 冬 季 “ 多 雪 ”, 否 则 预 报 “ 少 雪 ”。 用 这 一 方 法 对 丰 镇 1 95 9~ 1 9 7 0 年间隔 1 2 年 作 了 预 报 ,除 1965 年 以 外 均 报 对 , 历 史 拟 合 率 为 11 / 12。 §2-2 贴 近 度 与 模 式 识 别 的 间 接 方 法 一、贴近度 表 示 两 个 模 糊 集 接 近 程 度 的 数 量 指 标 ,称 为 贴 近 度 ,其 严 格 的 数 学 定 义如下: 定 义 1 设映射 N : F(U) F(U) → [0,1] 满足下列条件: ( 1 ) A F(U) , N(A, A) = 1 ( 2 ) A,B F(U) , N(A,B) = N(B, A) ( 3 ) 若 A, B,C F(U) 满 足 A(x) −C(x) A(x) − B(x) (x U) 有 N(A C) N(A B) 则称映射 N 为 F(U) 上 的 贴 近 度 , 称 N(A B) 为 A 与 B 的 贴 近 度 。 贴 近 度 的 具 体 形 式 较 多 , 以 下 介 绍 几 种 常 见 的 贴 近 度 公 式
(1) Hamming贴近度 Nn(A,B)=1-∑|4(x)-B(x 或Nn(A,B)=1- JA(x)-B(x)dx (2) Euclid贴近度 NE(A, B) (A(x)-B(x1) 成N(,B)=1-b=n(4x)-B()在 (3)格贴近度 定义7映射 N。:F(U)×F(U)→[0,1 (AB)→N2(4.B)=(AB)A(A⊙B),(或=[AoB+(A⊙B) 称为格贴近度,称N(A,B)为A与B格贴近度。其中 AB=V{4x)AB(x)∈U}(称为A与B的内积) A⊙B=^{4(x)vB(x)x∈U}(称为A与B的外积) 若U B=VA(x,AB(x) A⊙B=^{4(x1VB(x 值得注意的是,这里的格贴近度是通过定义来规定的,事实上,格贴 近度不满足定义1中(1),即N(A4)≠1 ⅤA∈F(U),A=φ,sppl≠U时,格贴近度满足定义1的(1)-(3)。另外格贴 近度的计算很方便,且用于表示相同类型模糊度的贴近度比较有效,所以 在实际应用中也常选用格贴近度来反映模糊集接近程度。 还有许多贴近度,这里不在一一介绍 贴近度主要用于模糊识别等具体问题,以上介绍的贴近度表示式各有
( 1) Ha m m i n g 贴近度 = = − − n i H i i A x B x n N A B 1 ( ) ( ) 1 ( , ) 1 或 − − = − b a H A x B x dx b a N A B ( ) ( ) ( ) 1 ( , ) 1 ( 2) E u c l i d 贴 近 度 = = − − n i E i i A x B x n N A B 1 2 ( ( ) ( )) 1 ( , ) 1 或 − − = − b a E A xi B xi dx b a N A B 2 ( ( ) ( )) 1 ( , ) 1 ( 3)格贴近度 定 义 7 映 射 N : F(U) F(U) → [0,1] g (A, B)→ Ng (A, B) = (A B) (A ⊙ c B) ,( 或 = [A B (A 2 1 + ⊙ ) ] c B ) 称 为 格 贴 近 度 , 称 N (A, B) g 为 A 与 B 格 贴 近 度 。 其 中 , A B = A(x) B(x) x U ( 称 为 A 与 B 的内积 ) A ⊙ B = A(x) B(x) x U ( 称 为 A 与 B 的外积 ) 若 U = x1 , x2 , , xn , 则 ( ( ) 1 i i n i A B = A x B x = A ⊙ ( ( ) 1 i i n i B = A x B x = 值 得 注 意 的 是 ,这 里 的 格 贴 近 度 是 通 过 定 义 来 规 定 的 ,事 实 上 ,格 贴 近 度 不 满 足 定 义 1 中 ( 1 ) , 即 Ng (A A) 1 , 但 是 , 当 AF(U), A1 = ,suppA U 时 , 格 贴 近 度 满 足 定 义 1 的 ( 1)- (3 )。 另 外 格 贴 近 度 的 计 算 很 方 便 ,且 用 于 表 示 相 同 类 型 模 糊 度 的 贴 近 度 比 较 有 效 ,所 以 在 实 际 应 用 中 也 常 选 用 格 贴 近 度 来 反 映 模 糊 集 接 近 程 度 。 还 有 许 多 贴 近 度 , 这 里 不 在 一 一 介 绍 。 贴 近 度 主 要 用 于 模 糊 识 别 等 具 体 问 题 ,以 上 介 绍 的 贴 近 度 表 示 式 各 有
优劣,具体应用时,应根据问题的实际情况,选用合适的贴近度。 二、模式识别的间接方法一一择近原则 在模式识别问题中,各标准类型(模式)一般是某个论域X上的模糊集,用模式识别 的直接方法(最大隶属度原则、阈值原则)解决问题时,其识别对象是论域X中的元素。 另有一类识别问题,其识别对象也是X上的模糊集,这类问题可以用下面的择近原则来识 别判决 择近原则:已知n个标准类型A1、A2、…、A∈F(X,B∈F(X)为待识别的对 象,N为F(X)上的贴近度,若 N(A, B)=max N(Ak, B)Ik=1,2,n) 则认为B与A最贴近,判定B属于A1一类 例5岩石类型识别 岩石按抗压强度可以分成五个标准类型:很差(A1)、差(A2)、较好(A3)、好(A4) 很好(A5)。它们都是X=[O,+∞)上的模糊集,其隶属函数如下(图2-1 A A(x)A(x) A2(x) A2(x) A1(x) 0200400 9001100 18002000x 图2-1 0≤X<10 A1(x)= (x-200) 100<x<200 ≥200 0≤x≤200 200 )= 200<x<400 (x-600) 400<x≤600 200 600<x
优 劣 , 具 体 应 用 时 , 应 根 据 问 题 的 实 际 情 况 , 选 用 合 适 的 贴 近 度 。 二、模式识别的间接方法——择近原则 在模式识别问题中,各标准类型(模式)一般是某个论域 X 上的模糊集,用模式识别 的直接方法(最大隶属度原则、阈值原则)解决问题时,其识别对象是论域 X 中的元素。 另有一类识别问题,其识别对象也是 X 上的模糊集,这类问题可以用下面的择近原则来识 别判决。 择近原则:已知 n 个标准类型 A1、 A2 、…、 A F(X ) n , B F(X ) 为待识别的对 象, N为F(X) 上的贴近度,若 N(Ai , B) = maxN(Ak , B) | k = 1,2, n 则认为 B 与 Ai 最贴近,判定 B 属于 Ai 一类。 例 5 岩石类型识别 岩石按抗压强度可以分成五个标准类型:很差( A1 )、差( A2 )、较好( A3 )、好( A4 )、 很好( A5 )。它们都是 X = [0,+) 上的模糊集,其隶属函数如下(图 2-1) 0 200 400 600 900 1100 1800 2000 图 2-1 − − = 0 200 ( 200) 100 200 100 1 1 0 x 100 ( ) 1 x A x x x − − = x x x x x x A x 0 600 ( 600) 400 600 200 1 1 200 400 0 200 200 ( ) 2 1 ( / ) 2 kg cm A ( ) 5 A x ( ) 4 A x ( ) 3 A x ( ) 2 A x ( ) 1 A x x