D0I:10.13374/i.issn1001053x.2001.01.051 第26卷第4期 北京科技大学学报 VoL.26 No.4 2004年8月 Journal of University of Science and Technology Beijing Aug.2004 一种基于生物免疫原理的识别算法 周颖四郑德玲》位耀光)付冬梅) 1)北京科技大学信息工程学院,北京1000832)河北工业大学电气与自动化学院,天津300130 摘要提出了一种人工免疫识别算法.该算法将所识别的数据作为抗原,利用抗体、抗原 的亲和作用,通过刺激/抑制有关抗体的活动建立一个抗体记忆集合,识别和表示数据结构组 织,它具有识别多样性、自我调节功能等特点,通过对二维实数空间的数据和Iis数据进行实 验,结果表明该方法聚类效果好,识别率高,且具有较好的泛化能力, 关键词免疫识别:亲和作用:抗体记忆:识别率 分类号TP18 自然界生物免疫系统是一个高度复杂的分 由骨髓产生并通过分祕抗体来实现抗原的识别 布协调自适应系统.该系统具有“自我/非我”识 和清除,T细胞在免疫反应过程中能刺激和抑制 别、自组织和学习、免疫记忆和免疫宽容等一系 B细胞的增殖和分化,对免疫调节也起着重要作 列独特的功能,能够有效地抵御入侵体内的细 用, 菌,构成了生物体免受病毒、异体侵害的天然屏 由于外部异己物千差万别,抗原入侵后,对 障,从而维持生命体的生存和进化.因此,抽取生 于免疫系统首次遇见的抗原,首先是抗体对抗原 物免疫系统特有的信息处理机制,建立人工免疫 进行识别(匹配),对于那些达到一定匹配度的抗 模型是人工智能研究领域中的重大课题之一,近 体就被激活并发生“克隆选择”和“细胞超变异”, 几年,许多学者利用免疫系统机制设计出多种免 以产生与抗原更好匹配的抗体以及能应付抗原 疫算法和模型,其研究成果涉及到控制、优化学 多样性,随着抗原被消灭,抗体的数目也大幅度 习、故障诊断等许多领域-刃.但有的算法和模型 下降.自然免疫系统具有一个记住原来入侵抗原 研究还处于研究阶段,存在着不少缺陷需要改 的机制,这就是免疫记忆.当同类抗原再次侵入 进.本文针对免疫系统能够识别无限多的抗原、 时,就会对相应的免疫记忆产生刺激作用,破坏 具有自我调节功能和对已识别的抗原具有快速 网络的稳定状态,使网络中的抗体急剧增加,从 响应的特点,针对文献[4]中ainet免疫网络,提出 而快速消灭抗原可, 一种人工免疫识别算法,用该算法对二维实数空 这一现象也说明了免疫系统的另一特点即 间的数据和著名的Fisher Iris数据进行实验,结果 抗体细胞的数量、特性都会随环境变化而变化 表明该方法聚类效果好,识别率高,且具有较好 因此,免疫系统实质上是一个动态随机系统.设 的泛化能力. b为时刻t的抗体数,则抗体的变化率可描述为: db 01=m-db(1-a)+rab (1) 1生物免疫原理 其中,m为来自骨髓的B细胞数(即抗体数):a为 免疫是机体的一种特异性生理反应,免疫系 被激活的抗体比率,0≤a≤1,1-a为未被激活的抗 统通过分布在全身的淋巴细胞识别和清除侵入 体比率;式(1)中右边第二项表示抗体的死亡,第 生物体的抗原性异物,维持内环境的稳定,T细 三项表示抗体的增值(抗体-抗体刺激和抗原-抗 胞和B细胞是淋巴细胞的两种主要类型,B细胞 体刺激),r和代表增殖和死亡的速率. 免疫系统对外来抗原的识别过程是一个寻 收稿日期200305-29 周颗女,32岁,博士研究生 找能够与抗原结合力最大的抗体的过程.本文利 *高校博士点专向科研基金资助项目No.20020008004)
第 ‘ 卷 第 期 佣 年 月 北 京 科 技 大 学 学 报 比 ’ 一 一种基于生物免疫原理 的识别算法 周 颖 ’, 郑德 玲 ” 位 耀光 ” 付冬梅 ” 北 京 科 技 大学信息 工程学 院 , 北 京 河 北 工 业 大学 电气 与 自动化 学 院 , 天津 摘 要 提 出 了一 种 人工 免疫 识 别 算法 该 算法将 所 识别 的 数据 作为抗 原 , 利 用 抗 体 、 抗 原 的亲和作用 , 通 过刺 激 抑制有 关抗体 的活动 建立 一 个抗 体记忆集合 , 识别 和表示数据 结构组 织 , 它 具 有 识 别 多样 性 、 自我调 节 功 能等特 点 通过 对 二 维 实数 空 间的数据 和 数据进 行 实 验 , 结 果表 明该 方 法 聚 类 效 果 好 , 识 别率 高 , 且 具 有 较好 的泛化 能 力 关键词 免疫 识 别 亲和 作用 抗体记忆 识 别 率 分 类号 自然 界 生 物 免 疫 系统 是 一 个 高 度 复 杂 的分 布 协 调 自适 应 系 统 该 系 统具 有 “ 自我 非 我 ” 识 别 、 自组 织 和 学 习 、 免 疫 记 忆 和 免 疫 宽容 等 一 系 列 独 特 的功 能 , 能 够 有 效 地 抵 御 入 侵 体 内 的细 菌 , 构 成 了生 物 体 免 受病 毒 、 异 体 侵 害 的天 然 屏 障 , 从而 维 持 生命 体 的生存 和 进 化 因此 , 抽 取 生 物 免疫 系统 特 有 的信息 处 理机 制 , 建 立 人 工 免 疫 模 型是 人 工 智 能研 究领 域 中的重 大课题 之 一 近 几 年 , 许 多学 者 利 用 免疫 系统机制 设 计 出多种 免 疫 算 法 和 模 型 , 其 研 究 成 果 涉 及 到 控制 、 优 化 学 习 、 故 障 诊 断等 许 多 领 域 ‘,川 但 有 的算 法和 模 型 研 究 还 处 于 研 究 阶 段 , 存 在 着 不 少 缺 陷 需 要 改 进 本文 针 对 免疫 系 统 能够 识 别 无 限 多 的抗 原 、 具 有 自我 调 节 功 能 和 对 己 识 别 的抗 原 具 有 快 速 响应 的特 点 , 针 对 文 献 」中 免 疫 网络 , 提 出 一种 人 工 免疫 识 别 算 法 , 用 该算 法对 二 维 实数 空 间 的数据 和 著 名 的 数 据 进 行 实验 , 结 果 表 明该 方 法 聚 类 效 果 好 , 识 别 率 高 , 且 具 有 较 好 的泛 化 能 力 生 物 免疫 原 理 免疫 是 机体 的一 种 特 异 性 生理 反应 , 免 疫 系 统 通 过 分 布 在 全 身的淋 巴 细 胞 识 别 和 清 除侵 入 生物 体 的抗 原性 异 物 , 维持 内环 境 的稳 定 细 胞 和 细 胞 是 淋 巴 细 胞 的两 种 主 要 类 型 , 细 胞 收稿 日期 刁 佗 周 颖 女 , 岁 , 博 士研 究生 高校博 士 点专 向科研基金 资助 项 目 由骨 髓 产 生 并 通 过 分 泌 抗 体 来 实现 抗 原 的识 别 和 清 除 细 胞 在 免 疫 反 应 过 程 中能刺激 和 抑 制 细 胞 的增 殖 和 分 化 , 对 免 疫 调 节 也起 着重 要 作 用‘,, 由于 外 部 异 己 物 千 差 万 别 , 抗 原 入 侵 后 , 对 于 免疫 系统 首 次遇 见 的抗 原 , 首先 是抗 体对抗 原 进 行 识 别 匹配 , 对 于 那 些 达 到 一 定 匹配 度 的抗 体 就 被激 活 并发生 “ 克隆选 择 ” 和 “ 细 胞超 变异 ” , 以产 生 与 抗 原 更 好 匹 配 的抗 体 以及 能应 付 抗 原 多样 性 随着抗 原 被 消 灭 , 抗 体 的数 目也 大 幅度 下 降 自然 免疫 系 统 具 有 一个 记 住 原 来 入侵抗 原 的机制 , 这 就 是 免疫 记 忆 当 同类 抗 原再 次侵 入 时 , 就 会对 相 应 的 免 疫记 忆 产 生 刺 激 作用 , 破坏 网络 的稳 定状 态 , 使 网 络 中 的抗 体 急剧 增加 , 从 而快 速 消 灭抗 原川 这 一 现 象 也 说 明 了 免 疫 系统 的 另 一 特 点 即 抗 体 细 胞 的数 量 、 特 性 都 会 随环 境 变 化 而 变 化 因 此 , 免 疫 系统 实质 上 是 一 个 动 态 随机 系 统 , 设 为 时刻 的抗 体 数 , 则 抗 体 的变 化 率可 描述 为 嚣 一 一 一 其 中 , 为 来 自骨 髓 的 细 胞 数 即 抗 体 数 为 被 激 活 的抗 体 比率 , ‘ ‘ , 一 为未 被激 活 的抗 体 比率 式 中右 边 第 二 项 表 示 抗 体 的死亡 , 第 三 项表 示 抗 体 的增 值 抗 体一抗 体刺 激和 抗 原一抗 体 刺激 , 和 代 表 增 殖 和 死 亡 的速 率 免 疫 系 统 对 外 来 抗 原 的 识 别 过 程 是 一 个 寻 找 能够 与抗 原 结合 力最 大 的抗 体 的过程 本文 利 DOI :10.13374/j .issn1001-053x.2004.04.051
VoL.26 No.4 周颖等:一种基于生物免疫原理的识别算法 ·439 用免疫系统的这一亲合现象与抗体的变化过程 整函数,norma(~)为归一化函数. 提出一种免疫识别算法来解决未标识数据集合 此外,克隆细胞要经历突变(伴随着高变异 的聚类和识别问题. 率)过程,从而使得新产生的细胞与所选择的抗 原以更高的亲和力相匹配,即免疫系统要以有限 2人工免疫系统识别算法 的资源识别无限的对象,这就是免疫系统的强大 的多样性识别能力,本文采用以下变异以增强抗 为了定量描述免疫抗体分子和抗原之间的 体识别抗原的能力, 相互作用,Perelson和Oster于1979年提出形态空 定义3抗体Ab经过变异为Abi,则: 间的模型周,利用数学概念定义一个分子的泛化 Ab=Ab,-a(Ab,-Ag) (5) 形态.本文在此基础上用一个实数坐标集合表示 其中,a=1-e-是抗体变异率. 抗体或抗原. 抗体、抗原越互补,亲和力越高,抗体变异率 定义1S为由抗体、抗原所构成的形态空 a越小:反之,抗体、抗原亲和力越低,抗体变异 间,L表示其维数.AB={Abi=1,2,,n}为抗体集 率a也越大,即抗体经过此变异后,增强了识别抗 合,AG={Agi=1,2,,m}为抗原集合,某一抗原 原的能力. Ag=y,“y}或抗体Ab,={x1x,x}分别为集 定理1抗体变异后,增强了识别抗原的能 合中的一个向量或一个坐标点, 力. 2.1亲和力计算 证明由定义1知某一抗体Ab,={xx,…x}, 抗原识别是通过表达在抗原分子表面的表 与某一抗原Ag={y,"y}的亲和力为a,设变 位和抗体分子表面的对位的化学基进行相互匹 异后的抗体Ab={xix,x},与同一抗原的亲和 配选择,匹配的程度用亲和力来度量,免疫系统 力为a. 识别抗原的过程是一个寻找能够与抗原亲和力 最大的抗体的过程.本文中抗原和抗体亲和力用 由于Ab,-Ag=√空,-WP≥0,所以e-a ≥L,0≤e-1a-≤1.又因为a=1-ea-,所以 改进的欧式距离来表示 0≤a≤1.则: 定义2在形态空间S中抗原Ag与抗体Ab,的 亲和力a,(0≤ag≤1)为: IAb-Ag=②[G,-a,-y》-P a=1naag4-2,h=12m公 -V2x1-a)-yw1-n=(1-/,-y Vp-1 =(1-alAb,-Agl≤‖Ab,-Agl, 其中,IAb,-Ag为S中Ab,与Ag两向量的范数, 所以有 本文用欧几里德(Euclidean)距离表示.距离越小, 最18 1- maxll Ab.-Agll' 亲和力越大 igsm 195m 同理定义抗体Ab:与Ab,抗体的亲和力s(0≤Sg 即a,≥a,定理得证. ≤1)为: 23抗体的刺激和抑制 5,=1 max AbAbl=1212.n (3) liAb-Ab 在本文算法中,抗体Ab,与抗体Ab,相互识别 1 导致相互刺激和抑制,抑制通过清除自身的细胞 抗体越相似,亲和力越大,抗体之间刺激或 进行,给定一个抑制阅值,抑制阈值的选取根据 抑制作用越强 下式: 2.2抗体的克隆和变异 NN ∑∑s# -力1 在免疫系统中,存在的抗体(B细胞)要对抗 4,=NN-1)/2 (6) 原进行竞争识别,那些竞争成功的细胞(与抗原 其中,5g为抗体间的亲和力,N为抗体的总个数. 亲和力高的抗体)就会增殖、分化,进行克隆选 2.4免疫识别算法 择,并同时经历着超变异,克隆与亲和力大小成 根据以上免疫过程提出如下免疫算法: 正比.文中按亲和力大小克隆抗体数目为N, stepl针对要处理的数据(可看作抗原),产生 N.Zround(N-normall Ab,-AgllN) (4) 初始抗体群: 其中,N为抗体的个数,round()为向最近整数取 step2对要处理的数据中的每一个做如下工
周 颖 等 一 种 基于 生 物 免疫原理 的识 别算法 , 用 免 疫 系 统 的这 一 亲 合 现 象 与抗 体 的变 化 过 程 提 出一 种 免疫 识 别 算法 来 解 决 未 标 识 数 据 集 合 的聚类 和 识 别 问题 人 工 免疫 系 统 识 别 算法 为 了定 量 描 述 免 疫 抗 体 分 子 和 抗 原 之 间 的 相互 作用 , 和 于 年提 出形 态 空 间 的模型 ‘引, 利用 数 学概念 定义 一个 分 子的泛 化 形 态 本文 在 此基 础 上用 一个 实数坐 标 集 合 表示 抗 体 或抗 原 定 义 兮 为 由抗 体 、 抗 原 所 构 成 的形 态 空 间 , 表 示 其 维 数 川 , ,… , 为 抗 体 集 合 , 二 丈 酬 , ,… , 为抗 原 集 合 , 某 一 抗 原 伽 ,孙 ,… 扒 或 抗 体 卫丙 , … 入 分 别 为 集 合 中 的一 个 向量 或 一 个 坐 标 点 亲和 力计 算 抗 原 识 别 是 通 过 表 达 在 抗 原 分 子 表 面 的 表 位 和 抗 体 分 子 表 面 的对 位 的化 学 基 进 行 相 互 匹 配选 择 , 匹 配 的程 度 用 亲 和 力 来度 量 免疫 系 统 识 别 抗 原 的过 程 是 一 个 寻 找 能够 与 抗 原 亲和 力 最 大 的抗 体 的过程 本文 中抗 原和抗 体亲 和 力用 改进 的欧式 距 离来 表 示 定义 在 形态 空 间兮 中抗 原 ,与抗 体 的 亲和 力马 ‘ 马‘ 为 一 ‘ 一 尚瓮裂氨 , ,一 , ,… ,·,,一 , ,… , 粼 其 中 , 厂 引 为梦 中 ,与 两 向量 的范 数 , 本文 用 欧几 里 德 距 离表 示 距 离越 小 , 亲 和 力越 大 同理 定 义 抗 体 ‘与 抗 体 的亲和 力以 ‘ 凡 ‘ 为 一 ‘一而黯黑 万 , ‘一 , ,… ,·, 、 一 , ,… ,· 马夕‘ ” 抗 体越 相 似 , 亲 和 力越 大 , 抗 体 之 间刺 激 或 抑 制 作用 越强 抗体 的 克隆和 变异 在 免疫 系统 中 , 存 在 的抗 体 细 胞 要 对 抗 原进 行 竟 争识 别 , 那 些 竞争成 功 的细 胞 与抗 原 亲和 力 高 的抗 体 就 会 增 殖 、 分 化 , 进 行 克 隆选 择 , 并 同时经 历 着 超 变 异 , 克 隆 与 亲 和 力 大 小成 正 比 文 中按亲 和 力大 小 克 隆抗 体数 目为 世 从 二 艺 , 『 一 肠日劝 其 中 , 为 抗 体 的个 数 , · 为 向最 近 整 数 取 整 函 数 , · 为 归 一 化 函 数 此 外 , 克 隆细 胞 要 经 历 突 变 伴 随着 高变 异 率 过程 , 从 而 使得 新产 生 的细胞 与所 选 择 的抗 原 以更 高 的亲和 力相 匹 配 , 即免 疫 系统 要 以有 限 的 资源 识 别无 限 的对 象 , 这就 是 免疫系 统 的强 大 的 多样性 识 别 能力 本 文 采 用 以下 变异 以增 强抗 体 识 别抗 原 的 能力 定义 抗 体 ,经 过 变 异 为 , 则 二 ‘一 ,一 肠 其 中 , 二 一 一 ,战 一 峪 ,是抗 体 变 异 率 抗 体 、 抗 原越 互 补 , 亲和 力越 高 , 抗 体变 异 率 越 小 反之 , 抗 体 、 抗 原 亲 和 力越低 , 抗 体 变异 率 也越 大 , 即抗 体经 过此变异 后 , 增 强 了识别抗 原 的 能 力 定理 抗 体 变 异 后 , 增 强 了识 别 抗 原 的能 力 证 明 由定义 知 某 一 抗 体 ‘ 丙 ,… 入 , 与 某 一 抗 原 伽泌 ,… 扒 的亲和 力 为 ,, 设变 异 后 的抗 体 卜 燕 ,… 成 , 与 同一抗 原 的亲 和 力 为喝 由于 ‘一 引 全 二 一 “, 一 酬 三 一 荡而 却 , 所 以 卜人副 又 因 为 一 一 奴一 “ “ , 所 以 ‘ ‘ 则 一 酬 ” 冬 一 ,一 一对 点,卜 一 卜 · 一 卜 · 拒…奋奋 一 一 酬 引 ‘一 酬 , 所 以有 一 一」孕续妞坛 瞥 日 以一 酬 一 ‘一 , 酬一 酬 ’ 粼 即试之 ,, 定 理得 证 抗 体 的刺 激 和 抑 制 在 本 文 算法 中 , 抗 体 ‘与抗 体 相 互 识 别 导致相 互刺 激和 抑 制 , 抑 制通 过清 除 自身的细 胞 进 行 , 给 定 一个抑 制 闭值 , 抑 制 闽值 的选 取 根据 下 式 四, 万 刃 艺艺今 , 不袭鉴导滚 、 从万一 其 中 , 。 为抗 体 间 的亲和 力 , 为 抗 体 的总个数 免疫 识 别 算 法 根据 以上 免疫 过 程 提 出如 下 免疫 算 法 针 对 要 处 理 的数 据 可 看 作抗 原 , 产 生 初 始抗 体 群 对 要 处 理 的数据 中 的每 一 个 做 如 下 工
440 北京科技大学 学 报 2004年第4期 作: 1.0 step2.1根据式(2)计算对所有抗体群体的亲 和力并排序; 0.8 step2.2按式(4),(5)克隆、变异抗体: 0.6 step2.3重新计算变异后抗体与抗原的亲和 0.4 力: 0.2 step2.4选择一定比例的高亲和力抗体,建立 一个抗体记忆矩阵M,清除亲和力低于一定阙值 的抗体(抗体死亡): 0.2 0.40.60.8 1.0 step2.5在记忆矩阵M,中,根据式(3)计算抗体 一抗体间的亲和力,亲和力越大抗体越相似,抑 图2识别抗原得到的抗体记忆集 制作用越强,根据式(⑥)选择抑制阙值清除相似 Fig.2 Antibody memory matrix received through recogni- zing antigens 抗体(抗体抑制): step3对在step2中得到的所有抗体记忆矩阵 45 Ab-[Ab,M]再进行抗体总体抑制.这一过程体 40 现了兔疫系统中的网络抑制,即搜寻不同克隆集 35 合中的相似抗体并将其去除: 30 step4如果满足终止判断条件则输出抗体记 33 忆矩阵,否则,再产生一部分抗体加入记忆矩阵 Ab-[Ab,rand(Ab]作为下一代免疫计算的抗体, 20 转到step2继续运算, 15 10 0 6 10 3实验结果 迭代次数/次 图3抗体变化曲线 图1描述了二维实数空间中的50个采样点 Fig.3 Varying curve of antibodies 分为5个密集类(看作抗原),每一类中包含10个 采样点. 采用20组数据进行识别,识别率为100% 1.5 0 此外本文还采用了著名的Fisher Iris数据模 1.0 + ao口 式进行分类、识别来证明以上模型的有效性例.因 料 0.5 为Fisher Iris数据用萼片和花瓣的长度、宽度来区 0 分三种不同的花(setosa,versicolor,,virginica),样本 ~肾口 点为四维,很难用图形来表达,这些数据包括三 0.5 类,且每一类包括50个样本.这些变量间存在很 0 -1.0x * 强的耦合关系,各状态在样本空间重叠很严重, -1. 增加了数据聚类的难度.采用本文方法,选取90 -1.5-1.00.5 0 0.5 1.0 1.5 组数据作为训练,60组作为检测,识别率为 86.3%. 图1二维实数空间抗原训练模式 Fig.1 Antigen training model in the two-dimension real 为了进一步验证本算法的有效性,本文还用 number space 自组织特征映射网络(SOM网)对以上两种数据 进行分类识别(训练与检测的样本同上),在合适 采用本文算法,得到抗原的压缩聚类如图2 选择参数的情况下得到以下结果:对于二位实数 所示,也就是得到的抗体记忆矩阵,图中用“。”表 空间识别率为100%,而对于is数据识别率为 示,“◆”为抗原的聚类中心.从图3中可以看出当 79,2%.可以看出采用本文算法聚类效果好,识别 迭代次数N在10左右时抗体数目基本得到稳定, 率高
翻 北 京 科 技 大 学 学 报 年 第 期 作 根 据 式 计 算 对 所 有 抗 体 群 体 的亲 和 力 并 排 序 按 式 , 克 隆 、 变异 抗 体 重 新 计 算 变 异 后 抗 体 与 抗 原 的 亲 和 力 选 择 一 定 比例 的高亲和 力抗 体 , 建 立 一个抗 体记忆矩 阵麟 , 清除亲和 力低 于 一 定 闽值 的抗 体 抗 体 死 亡 在 记忆矩 阵麟中 , 根据 式 计 算抗体 一 抗 体 间 的亲 和 力 , 亲和 力越大 抗 体越 相 似 , 抑 制 作 用越 强 , 根据 式 选 择抑 制 闽值 清 除相 似 抗 体 抗 体 抑 制 对 在 中得 到 的所 有 抗 体 记 忆 矩 阵 一 称〕再 进 行 抗 体 总 体抑 制 这 一 过程 体 现 了免疫 系统 中的 网 络抑 制 , 即搜 寻 不 同克 隆集 合 中 的相 似 抗 体 并将 其 去 除 如 果 满 足 终止 判 断 条件 则输 出抗 体 记 忆 矩 阵 , 否 则 , 再 产 生 一 部 分 抗 体加 入记 忆 矩 阵 一 , 作 为 下 一 代 免疫 计 算 的抗 体 , 转 到 继 续 运 算 尸 气夕 , · 公 ” …从 毛 圈 识别 抗原得到 的 抗体记 忆 集 啥 柱加川 口 加 皿沙 沁俄,卜 ,,乙︶民月弓 ︸勺、﹃ 令粼耸、撼血 汽‘,‘ ︸亡 实验结 果 图 描 述 了二 维 实 数 空 间 中 的 个采 样 点 分 为 个 密 集类 看 作 抗 原 , 每 一类 中包 含 个 采 样 点 迭 代 次数 次 图 抗体 变化 曲线 物 恤 。 马留 料幸沙 。 口 气 众价 刁 刃 一 一 一 一 一 图 二 维 实数 空 间抗 原 训 练模式 哈 廿 恤 恤 幻片仆 彻 。 加 采 用本 文 算 法 , 得 到抗 原 的压 缩 聚 类 如 图 所 示 , 也 就 是得 到 的抗 体 记 忆矩 阵 , 图 中用 ‘,” 表 示 , “ ” 为抗 原 的聚 类 中心 从 图 中可 以看 出当 迭代 次数 在 左 右 时抗 体数 目基本 得 到 稳 定 采 用 组 数 据 进 行 识 别 , 识 别 率 为 此 外 本 文 还 采 用 了著名 的 数 据 模 式进 行分 类 、 识 别 来证 明 以上模型 的有效性例 因 为 数据 用 尊 片和 花瓣 的长度 、 宽度 来 区 分 三 种 不 同 的花 , , 吨 , 样本 点 为 四维 , 很难 用 图形 来 表 达 这 些 数 据 包 括 三 类 , 且 每 一 类 包 括 个 样 本 这 些 变 量 间存 在 很 强 的藕合 关 系 , 各状 态 在 样 本 空 间重 叠 很 严 重 , 增 加 了数 据 聚类 的难 度 采 用 本 文 方 法 , 选 取 组 数 据 作 为 训 练 , 组 作 为 检 测 , 识 别 率 为 为 了进 一 步验 证 本 算法 的有效 性 , 本 文 还 用 自组 织特 征 映射 网络 网 对 以上 两 种 数 据 进 行 分 类 识 别 训 练 与检测 的样 本 同上 , 在 合 适 选 择 参 数 的情况 下 得 到 以下 结果 对于 二位 实数 空 间识 别 率 为 , 而 对 于 数 据 识 别 率 为 可 以看 出采用 本文 算 法聚类 效 果 好 , 识别 率 高
Vol.26 No.4 周颗等:一种基于生物免疫原理的识别算法 441· 4结论 3韦巍,张国宏,人工免疫系统及其在控制系统中的 应用[U.控制理论与应用,2002,192):157 根据免疫原理提出的人工免疫识别算法,将 4 De Castro,Fernando J.An Evolutionary Immune Network 所要处理的数据看作抗原,抗体作为抗原的内影 for Data Clustering [A].Proceedings of the IEEE SBRN 像,通过对抗体的克隆和变异增加了对抗原的识 [C],2000,11:84 别能力,用两种数据进行仿真实验,结果证明该 5漆安慎,杜婵英,免疫的非线性模型M.上海:上海 方法聚类效果好,识别率高,且具有较好的泛化 科技教育出版社,1998 6刘克胜,张军,曹先彬,等,一种基于免疫原理的自 能力,该算法具有识别多样性和学习能力,还可 律机器人行为控制算法[).计算机工程与应用, 用于数据分析、数据挖掘等信息处理问题, 2000,5:30 参考文献 7葛红,毛宗源.一种新的数据分析方法:人工免疫网 络J].计算机工程与应用,2002(13):6 1郑德玲,梁瑞鑫,付冬梅,等,人工免疫系统及人工8 Perelson A S,Oster G F.Theoretical studies of clonal se- 免疫遗传算法在优化中的应用[切.北京科技大学学 lection:Minimal antibody repertoire size and reliability of 报,2003,10(3):57 self-nonself discrimination [J].J Theor Biol,1979(81): 2梁瑞鑫,郑德玲,周颗,等。免疫遗传算法在高炉焦 645 比目标优化中的应用[A].第二十一届中国控制会 9 Timmis J,Neal M,Hunt J.An artificial immune system for 议论文集[C].杭州:浙江大学出版社,2002.8 data analysis [J].BioSystems,2000,55:143 Recognition Algorithm Based on Biological Immune Principle ZHOU Ying2,ZHENG Deling",WEI Yaoguang,FU Dongmei 1)Information Engineering School,University of Science and Technology Beijing,Beijing 100083,China 2)School of Electrical Engineering and Automation,Hebei University of Technology,Tianjin 300130,China ABSTRACT An artificial immune recognition algorithm is proposed.Inspired by the metaphor of the interaction of antibodies with antigens,it processes the data as antigens,and then gets an antibody memory matrix by inspiring or restraining the activity of antibodies.The ability of data recognition and data structure description can be achieved by the memory matrix.The algorithm has the characteristics ofrecognition variety and self-adjustment.Experiment results demonstrate that the algorithm has good clustering effect and high recognition rate on R'space data and iris data. KEY WORDS immune recognition;interaction of binding;memory antibodies;recognition rate
周 颖等 一 种 基 于 生 物 免疫原理 的识 别 算法 结论 根据 免疫 原理 提 出的人 工 免疫 识 别 算法 , 将 所 要 处理 的数据 看 作抗 原 , 抗体作 为抗 原 的 内影 像 , 通 过对 抗 体 的克隆和 变异 增 加 了对 抗 原 的识 别 能力 用 两 种数据 进 行 仿 真实 验 , 结 果 证 明该 方法 聚 类 效 果 好 , 识 别 率 高 , 且 具 有 较好 的泛 化 能力 该算 法 具 有 识 别 多样 性和 学 习 能 力 , 还 可 用 于数据 分析 、 数据 挖 掘 等信 息处 理 问题 参 考 文 献 郑 德 玲 , 梁 瑞鑫 , 付 冬梅 , 等 人 工 免疫 系 统 及人工 免疫遗传算法 在优化 中的应用 明 北 京科技大 学 学 报 , , 梁瑞 鑫 , 郑 德玲 , 周 颖 , 等 免疫遗 传 算法 在 高炉焦 比 目标优 化 中的应 用 第 二 十 一 届 中国控 制 会 议论 文集 〔 杭州 浙江 大 学 出版 社 , 韦 巍 , 张 国宏 人工 免疫 系 统及 其在 控 制系 统 中的 应 用 控 制 理 论 与应用 , , , 田下 ” 如四 , , 漆 安慎 , 杜掸英 免疫 的非线 性模型 【 』上 海 上 海 科技 教 育 出版 社 , 刘 克胜 , 张军 , 曹先彬 , 等 一 种 基 于 免疫原理 的 自 律 机 器 人 行 为控 制 算 法 计 算 机 工 程 与 应 用 , , 葛 红 , 毛 宗源 一种新 的数据 分析 方法 人 工 免疫 网 络 计 算机 工 程 与应 用 , , 以 滋 田 , 而 , , 幻口 , , 儿心 , 付忍 扩 , 牙百了 口 丫 , 口” 阴 , , , , 呱 既 , 翅 初 , , 五 知 】 酗 牙