D0I:10.13374/i.issn1001-053x.2001.03.025 第26卷第3期 北京科技大学学报 Vol.26 No.3 2004年6月 Journal of University of Science and Technology Beijing Jun.2004 一种人工免疫应答模型的研究及应用 位耀光郑德玲周颖王英 付冬梅 北京科技大学信息工程学院,北京I00083 摘要提出一种基于生物免疫应答机理的人工免疫应答模型.它包括抗原匹配、克隆选择、 变异、亲和力成熟等四个过程,通过克隆、变异过程实现抗体的多样性使所建立的系统具有 较好的自适应能力,利用亲和力成熟过程完成知识的学习和积累,该模型具有运行参数少, 稳定性好的特点,在提高数据压缩率和识别率方面具有较好的效果. 关键词人工免疫系统:免疫应答;克隆:变异;数据分析 分类号TP18 人工免疫系统(AIS)可被看作是采用生物免 再次应答.初次应答发生在免疫细胞初次遇到某 疫系统的观点、概念、理论和方法来解决实际工 种抗原并与其发生作用时.初次应答一般需要一 程计算问题,如模式识别、优化计算.”、病毒检 段相当长的时间来消灭抗原.当同样的抗原再次 测、机器学习等.各种基于生物免疫机理的人工 入侵时,免疫系统迅速产生特定的二次应答.从 免疫系统在机器学习、数据聚类分析及模式识 计算科学的观点看初次应答对应于对训练数据 别中的应用实例表明人工免疫系统具有良好的 进行学习,二次应答对应于模式聚类问题,即把 数据处理、分析能力, 新输入的数据归为相应的类别.值得注意的是, 免疫系统通过抗体与抗原的亲合作用来达 二次应答不仅会由同样抗原的再次侵入引起,还 到消除异己、维持自身动态平衡的日的.利用免 会由相似抗原的侵入引起,这也就是通常所说的 疫系统的亲合现象来解决模式识别问题是人工 免疫记忆具有联想性, 免疫系统的一个重要研究方向.Hunt首先研究 免疫应答的基本过程由三个阶段组成:感应 了人工免疫系统在模式识别领域中的应用,提出 阶段、增殖分化阶段和效应阶段.本文通过抗原 了骨髓功能模拟.Timmis提出基于独特型网络学 匹配、抗体克隆选择、抗体变异及亲和力成熟四 说的有限资源人工免疫模型(RLAIS)s,de Cas- 过程描述上述三个阶段 to提出基于克隆选择学说的人工免疫网络 (aiNET)m,Watkins提出的基于RLAIS的人工免疫 2人工免疫应答模型 识别模型(ARS)列. 免疫系统由B细胞及附着在其上的抗体组 1免疫应答机理 成,在本文所建立的模型中B细胞被简化为抗 体,通过研究抗体与抗原之间的相互作用来描述 免疫应答作为生物免疫系统调节生物体自 免疫应答过程,人工免疫应答模型所采用的生物 身动态平衡的一个重要手段,是抗原选择具有特 免疫机理主要有:利用抗体和抗原的模式匹配机 异性的淋巴细胞,使之活化、增殖、分化并产生免 制定义亲和力和抗体所受到的刺激:利用变异机 疫效应,使机体避免抗原侵害的过程.简而言之, 制产生抗体的多样性:利用独特型网络的思想获 免疫应答是机体对入侵的自身防御反应, 得所学习对象的记忆. 免疫系统具有两种形式的应答:初次应答和 2.1初次应答 1)初始化与抗原匹配.抗体对抗原的识别是 收稿日期200307-02位耀光男,27岁,博士研究生 免疫系统最重要的功能,也是引起免疫应答的首 +高等学校博士学科点专项科研基金No.20020008004)
第 卷 第 期 年 月 北 京 科 技 大 学 学 报 一种人工 免疫应 答模型 的研究及应用 位 耀 光 郑德 玲 周 颖 王 英 付冬梅 北 京 科技大 学信 息 工 程 学 院 , 北 京 摘 要 提 出一 种 基 于 生物 免 疫 应 答 机理 的人 工 免疫 应 答 模 型 它 包 括 抗 原 匹 配 、 克 隆选 择 、 变 异 、 亲 和 力 成 熟 等 四个过 程 , 通 过 克隆 、 变 异 过 程 实现 抗 体 的 多样 性使所 建立 的系 统 具 有 较 好 的 自适 应 能 力 , 利用 亲和 力成 熟 过 程 完 成 知 识 的 学 习 和 积 累 该模 型 具 有 运 行 参 数 少 , 稳 定 性 好 的特 点 , 在 提 高数 据 压 缩率和 识 别 率方 面 具 有 较好 的 效 果 关键 词 人 工 免疫 系统 免疫应 答 克隆 变 异 数据 分 析 分 类号 人 工 免 疫 系统 可 被 看作 是采 用 生物 免 疫 系 统 的观 点 、 概 念 、 理 论 和 方 法 来 解 决 实 际 工 程 计 算 问题 , 如模 式 识 别 、 优 化 计 算 「‘ ” 、 病 毒 检 测 、 机 器 学 习 等 各 种基 于 生 物 免 疫机 理 的人 工 免疫 系统在机 器 学 习 、 数据 聚类 分 析 ‘, , 及 模 式 识 别 中 的应 用 实 例 表 明人 工 免 疫 系 统 具 有 良好 的 数 据 处 理 、 分 析 能 力 免 疫 系 统 通 过 抗 体 与 抗 原 的 亲 合 作 用 来 达 到 消 除异 己 、 维 持 自身动 态 平 衡 的 目的 , 利 用 免 疫 系 统 的亲 合 现 象 来 解 决模 式 识 别 问题 是 人 工 免疫 系 统 的一 个 重 要研 究 方 向 ‘ , 首 先研 究 了人 工 免疫 系统在 模 式识 别领 域 中 的应 用 , 提 出 了骨髓 功 能模 拟 提 出基 于独 特 型 网络 学 说 的有 限 资源 人 工 免 疫模 型 ‘, ’ ‘ ,, 提 出 基 于 克 隆 选 择 学 说 的 人 工 免 疫 网 络 ,, 伯 提 出 的基 于 从 的人 工 免疫 识 别模 型 “ ,,, 再 次应 答 初 次应答 发 生 在 免疫 细胞 初 次遇 到某 种 抗 原 并与其 发 生 作用 时 初 次应 答 一 般 需要 一 段 相 当长 的时 间来 消灭 抗 原 当 同样 的抗 原再 次 入侵 时 , 免 疫 系 统 迅 速 产 生特 定 的二 次应 答 从 计 算 科 学 的观 点 看 初 次 应 答 对 应 于 对 训 练 数 据 进 行 学 习 , 二 次应 答 对 应 于 模 式 聚 类 问题 , 即把 新输 入 的数 据 归 为相 应 的类 别 值 得 注 意 的是 , 二 次应 答 不仅会 由同样 抗 原 的再 次侵 入 引起 , 还 会 由相似 抗 原 的侵 入 引起 , 这 也就 是通 常所 说 的 免疫 记 忆 具 有联 想 性 免 疫应 答 的基 本 过 程 由三 个 阶 段 组 成 感 应 阶 段 、 增 殖 分化 阶段 和 效应 阶 段 本 文 通 过 抗 原 匹 配 、 抗 体 克 隆选 择 、 抗 体变 异 及 亲和 力 成 熟 四 过 程 描 述 上 述 三 个 阶 段 免疫应 答机 理 免 疫 应 答 作 为 生 物 免 疫 系 统 调 节 生 物 体 自 身动 态平衡 的一 个 重 要手 段 , 是抗 原选 择 具有特 异 性 的淋 巴 细胞 , 使 之 活化 、 增殖 、 分化 并产 生 免 疫 效应 , 使机 体避 免抗 原侵 害 的过程 简而 言之 , 免疫 应 答 是机 体对 入 侵 的 自身 防御 反应 免疫 系统 具 有 两种 形 式 的应 答 初 次应 答和 收稿 日期 一 一 位耀 光 男 , 岁 , 博 士 研 究生 高等学校博士 学科点专 项科研基金 以 人 工 免疫应 答模 型 免 疫 系统 由 细 胞 及 附着 在 其 上 的抗 体 组 成 在 本 文 所 建 立 的模 型 中 细 胞 被 简化 为抗 体 , 通 过 研 究抗 体 与抗 原之 间 的相 互 作用 来描 述 免疫应 答 过程 人工 免疫 应 答 模 型所 采用 的生物 免 疫机 理 主 要 有 利 用 抗 体和 抗 原 的模式 匹配机 制 定义 亲和 力和 抗 体所 受 到 的刺激 利 用变 异 机 制产 生 抗 体 的多样 性 利 用独特 型 网络 的思 想 获 得 所 学 习 对 象 的记 忆 初 次 应 答 初 始 化 与抗 原 匹 配 抗 体 对 抗 原 的识 别 是 免疫 系统 最 重要 的功 能 , 也是 引起 免疫 应答 的 首 DOI :10.13374/j .issn1001-053x.2004.03.025
Vol.26 No.3 位耀光等:一种人工免疫应答模型的研究及应用 323 要条件,识别必须满足一些条件,当两个具有互 正比,受激励越大的抗体克隆的数目越多:受激 补特性的细胞相遇时,它们相互之间结合力(亲 励越小的抗体克隆的数目越少.由于受抗原a激 和力)的大小取决于二者之间的互补程度.为了 励所导致的抗体a的克隆数目为: 解决抗体对抗原的匹配识别问题,这里引入Per [S(i,j),D(i,j)> ci,)={0其他 (6) elson提出的形态空间概念): 假如有个特征影响分子之间的相互作用, 抗体a,经克隆选择过程后新生成的抗体矩阵c 为: P是第i(1,,m)个特征,则每个分子可被表示 c 为m维空间SS=P×…×P,S可以是m维海明空间 C,=apiUabU.Uabein=U as (7) 或m维欧氏空间)中的一个点, 相应的抗体A,经克隆选择过程后新生成的抗体 将待处理的数据作为抗原(A:),对其进行标 矩阵A为: 准化,则系统中的抗原为: Ai=ciUcU...Uci=Uc (8) an-…aem 3)变异,克隆细胞要经历突变(伴随着高变 Ag=(ag1…a'= …. (1) 异率)过程,从而使得新产生的细胞与所选择的 agnl'agnm) 抗原以更高的亲和力相匹配.在变异过程中每种 aw∈[0,1]",i=1,,m;j=1,,m 免疫细胞变异的速率与细胞受体受抗原的激励 式中,aw表示第i个抗原:a表示第i个抗原的第j 个向量. 程度的大小成反比:其受抗原的激励越大,变异 越小:其受抗原的激励越小,变异越大.定义 通过随机产生: a611a61m Mut(i,i)=D(i,i) (9) A=(a。…aw)'= . (2) 为抗体ay受到抗原4刺激后新产生的抗体的变 awi'…ahtm 异率.由抗原a入侵引起的av的克隆所生成的抗 ag∈[0,1],i=1,…,kj=1,…,m 体c变异为: 作为新生成的抗体.式中,4表示第i个抗体,av表 G=c+Muti,ji)×(c-a) (10) 示第个抗体的第个向量. 经过变异过程后免疫系统的抗体为: 把抗原与抗体间的欧氏距离作为衡量二者 A.=ciUc;U..-Uci=Uc (11) 之间匹配程度的一个指标.将抗原中的每个元素 变异保证了新产生的抗体具有充足的多样 分别与抗体中的每个元素相匹配,对任意抗原a。 性,这是免疫系统强化学习机制的内在的特性, 和任意抗体aw,二者之间的距离D()可通过下式 系统通过重复进行上述工作来增强自己识别抗 计算: 原的性能, D(i)=((a-ay (3) 4)亲和力成熟,免疫应答的亲和力成熟过 对任意aw(ayEA,户l,…,k),所受到的来自抗原a 程,类似于物种的自然选择过程.经克隆变异后 (aeA,l,…,n)的激励Si)为: 的抗体中那些具有较高抗原刺激度的抗体转化 D(ij).D(ins, 1 为具有较长寿命的记忆细胞,而那些具有较低抗 S,)= (4) 原刺激度的抗体则随着抗原的消亡而消亡,由于 0, 其他 抗体细胞之间的互相识别易引起自身免疫应答 i=1,,;j=1,…,k 反应,因此,为了消除自身免疫,需要对那些能够 式中, 22D功 自我识别的抗体进行抑制,定义 S÷ (5) D,) nxk Su= (12) 2 p×p-1D 表示抗原对抗体激励的域值 为系统选择记忆细胞的域值,则抗体经亲和力成 2)克隆选择,当抗体所受到来自抗原的刺 熟过程后转化为记忆细胞: 激达到一定程度(D(<S)时,免疫系统被激活, 系统开始对抗体进行克隆增殖.增殖是指免疫细 46gs如 (13) 胞发生无性、有丝分裂.自我复制(没有交叉)的 j=1,…,p. 过程,抗体克隆的数目与其所受到的激励水平成 其中,p为抗体抑制域值
心 位 耀 光 等 一 种 人 工 免疫应 答模 型 的研 究及 应 用 要 条 件 识 别 必 须 满足 一 些 条 件 当两 个 具 有 互 补 特 性 的 细 胞 相 遇 时 , 它 们 相 互 之 间结 合 力 亲 和 力 的大 小取 决 于 二 者 之 间 的互 补 程 度 为 了 解 决抗 体 对 抗 原 的 匹 配 识 别 问题 , 这 里 引入 提 出 的形 态 空 间 概念 〔 假 如 有 个 特 征 影 响 分 子 之 间 的相 互 作 用 , 尸 ‘是 第 份 , … , 个特 征 , 则每个 分 子 可 被 表 示 为 维 空 间 匕 二 ‘ 氏 , 可 以是 维 海 明空 间 或 维 欧 氏空 间 中 的一 个 点 将 待 处 理 的数 据 作 为抗 原 禹 , 对 其进 行 标 准 化 , 则 系 统 中 的抗 原 为 正 比 , 受 激 励 越 大 的抗 体 克 隆 的数 目越 多 受 激 励 越 小 的抗 体 克 隆 的数 目越 少 由于 受 抗 原 激 励 所 导 致 的抗 体 、 的克 隆数 目为 , , , , 及 , 其他 」 了 、 , 一 召 、 〔 , 〕 , , ,… , 二 , … , 式 中 , ,表 示第 个 抗 原 凡、 表 示 第 个抗 原 的第了 个 向量 通 过 随 机产 生 】 … 二 、 ,… ’ 口 ‘ 二 口腼 ,任 〔 , 」 ’ , ,… , , … , 脚 作 为 新 生 成 的抗 体 式 中两 潇表 示第 个 抗 体 , 几,表 示 第 个 抗 体 的第了个 向量 把 抗 原 与 抗 体 间 的 欧 氏距 离作 为 衡 量 二 者 之 间 匹 配程 度 的一 个 指 标 将 抗 原 中 的每 个 元 素 分 别 与抗 体 中 的每 个 元 素 相 匹 配 , 对 任 意抗 原丙 和任 意抗 体 , 二 者 之 间 的距 离 份 可 通 过 下 式 计 算 。 。 卜 叠 · 一。 告 对 任 意气 任浅, , … , , 所 受 到 的来 自抗 原 任次户 ,… , 的激 励 为 , , , 瑟 其 他 二 , … , 二 ,… , 式 中 , 艺 艺 ’ 已生常「 抗 体 经 克 隆 选 择 过 程 后 新 生 成 的抗 体 矩 阵 为 人 芍 日 一 、 ,〕 卜 相 应 的抗 体 经 克 隆 选 择 过 程 后 新 生 成 的 抗 体 矩 阵 为 是 … ‘ 斤 变 异 克 隆细 胞 要 经 历 突 变 伴 随着高变 异 率 过 程 , 从 而 使 得 新 产 生 的细 胞 与所 选 择 的 抗 原 以更 高 的亲和 力相 匹 配 在 变 异 过 程 中每 种 免 疫 细 胞 变 异 的速 率 与 细 胞 受 体 受 抗 原 的激 励 程 度 的大 小成 反 比 其 受抗 原 的激 励越 大 , 变 异 越 小 其 受 抗 原 的激励 越 小 , 变 异 越 大 定 义 , , ’ 为抗 体 、 受 到 抗 原凡 ‘刺 激 后 新 产 生 的抗 体 的 变 异 率 由抗 原凡 ‘入 侵 引起 的氏 的 克 隆所 生 成 的抗 体 变 异 为 , 芍一 , 经 过 变 异 过 程 后 免 疫 系 统 的抗 体 为 二二 , 众 一 。 ‘ 卜 变 异 保 证 了 新 产 生 的抗 体 具 有 充 足 的 多 样 性 , 这 是 免 疫 系 统 强 化 学 习 机 制 的 内在 的特 性 , 系 统 通 过 重 复 进 行 上 述 工 作 来 增 强 自己 识 别 抗 原 的性 能 亲 和 力 成 熟 免 疫 应 答 的亲 和 力 成 熟 过 程 , 类 似 于 物 种 的 自然 选 择 过 程 经 克 隆变 异 后 的抗 体 中那 些 具 有 较 高 抗 原刺 激 度 的抗 体 转 化 为具 有 较 长 寿命 的记 忆 细 胞 , 而 那 些 具 有较 低 抗 原刺激 度 的抗 体 则 随着抗 原 的消亡 而 消亡 由于 抗 体 细 胞 之 间 的互 相 识 别 易 引起 自身 免 疫 应 答 反 应 , 因此 , 为 了消除 自身免疫 , 需要对 那 些 能够 自我 识 别 的抗 体 进 行 抑 制 定 义 全全 , 、 , ‘ 一 - 上纽里一一 一月一、 切 一 表 示 抗 原对 抗 体 激 励 的域 值 克 隆选 择 当抗 体气所 受 到 来 自抗 原 的刺 激 达 到 一 定 程 度 凡 时 , 免 疫 系统 被 激 活 , 系 统 开 始对 抗 体进 行 克 隆增 殖 增 殖 是 指 免疫 细 胞 发 生 无 性 、 有丝 分 裂 自我 复 制 没 有 交叉 的 过程 抗 体克 隆 的数 目与其 所 受 到 的激励 水 平 成 为系统选 择 记 忆 细 胞 的域 值 , 则抗 体 经 亲和 力成 熟 过 程 后 转 化 为 记 忆 细 胞 、 , , 户 , 其 他 , … , 其 中 , 为抗 体 抑 制 域值
·324· 北京科技大学学报 2004年第3期 免疫系统通过对所处理数据的训练学习,获 测样本,用以检验其数据识别功能.在实验过程 得抗体记忆矩阵MM=({m,m2,…m;m∈[0,1],i=1, 中,通过逐渐改变抗体抑制域值p的大小,来研 …,z),完成知识的学习和经验的积累.它对后续 究其对数据压缩率和识别正确率的影响.实验结 的由相同或相似的抗原引起的再次应答过程起 果如图1和图2所示, 关键的作用. 100 2.2再次应答 0,003g290a4996* 由于抗原入侵导致免疫系统的应答,免疫细 80. 00 胞经历抗原匹配、克隆选择、变异、亲和力成熟等 米米 阶段后生成抗体记忆矩阵,该抗体记忆矩阵是由 60 米、 一*-lis数据 于抗原的入侵引起的,其与入侵抗原存在着某种 端子 …随机数 对应映射关系,这也就是通常所说的抗体是抗原 40. 在免疫系统内的内映像.当免疫系统再次遇到同 20 一抗原或类似抗原的入侵时,由于抗体记忆矩阵 0.05 0.10 0.15 0.20 的存在,免疫系统迅速产生特定的应答反应,把 p 相应的抗原归为已存在的类别, 图1p对压缩率的影响 综上所述,本文所提出的人工免疫应答模型 Fig.1 Effect of p on compression ratio 具有以下特征:通过初次应答建立抗体记忆矩阵 100 9e0e9906696660o96696e99O90T 来描述原始数据的特征:通过二次应答完成对相 应数据的识别.在实际计算中,可以利用它的上 80 来来 述特性来实现数据压缩和数据识别功能 60 ……随机数 3人工免疫应答模型的应用 -*-lris数据 40 在实际生产中,为了尽可能反映原始数据特 0.05 0.10 0.15 0.20 征,就尽量多的采集样本,这样使得样本空间急 剧膨张,造成所谓的“维数灾难”.由于所采集的 图2p对识别率的影响 数据相互之间存在着一定的相关性,有很大的数 Fig.2 Effect of p on recognition ratio 据冗余.因此可以利用本文所提出的免疫应答模 由图1可以看出,随着p的增加,抗体间相互 型对这些数据进行预处理,达到数据压缩,减少 抑制程度的增加,使得生成的记忆矩阵规模迅速 数据冗余的目的 降低,数据压缩率随之不断增大,即该算法对待 通过下述实验来实现该模型在数据压缩和 所处理数据的压缩率与P成正比,p值越大则压 数据识别中的应用.采用两组数据进行数值实 缩率越大、 验:其一是一维空间中随机产生的210组数据, 由图2可以看出,P的取值较小时对于识别 这些数据由7类组成,每类含有30组数据:其二 正确率影响不是很明显,但是如果P值选取过 是Fisher提出的iris数据,它由setosa,,versicolor,,vir- 大,由于抗体记忆矩阵得到过度抑制,使得产生 ginica三类(每类50组)共150组数据组成,每组 的记忆矩阵损失了大量的信息,不能很好地描述 数据分别由萼片的长度、萼片的宽度、花瓣的长 原始数据,容易造成识别结果的波动,因此在实 度、花瓣的宽度组成 际应用中要选取适当的p值. 定义数据压缩率Cm为: 由图1和图2可以看出:当p取0.1时,二维 C=4-sMx100 S(A) (14) 随机数的压缩率为92.85%,识别率为100%:Iis数 式中,SA)表示原始数据样本数:S)表示抗体 据的压缩率为79167%,识别率为94.4%.系统具 记忆矩阵样本数. 有较高的数据压缩率和数据识别率, 实验中先提取部分样本作为训练数据,采用 从数值实验结果看,本文所提出的免疫应答 本文所提出的模型对其进行训练学习,以验证该 模型具有很强的数据压缩、数据识别能力,可被 模型的数据压缩功能,而后把余下的数据作为检 广泛应用于复杂数据的分析处理过程
北 京 科 技 大 学 学 报 年 第 期 测 样 本 , 用 以检 验 其 数据 识 别 功 能 在 实验 过 程 中 , 通 过 逐 渐 改变 抗 体 抑 制 域值 的大 小 , 来研 究 其对 数据 压缩 率和 识 别 正 确 率 的影 响 实验 结 果 如 图 和 图 所 示 哥涤芝国 免疫 系 统通 过 对 所 处 理 数 据 的训 练 学 习 , 获 得抗 体 记忆矩 阵材伽卜 。 , , … 任「 , 〕 ·, , … , , 完成 知 识 的学 习 和 经 验 的积 累 它 对 后 续 的 由相 同 或 相 似 的抗 原 引起 的再 次 应 答 过 程 起 关 键 的作 用 再 次应 答 由十 抗 原入 侵 导致 免疫 系统 的应 答 , 免 疫 细 胞经 历 抗 原 匹 配 、 克 隆选 择 、 变异 、 亲 和 力成 熟等 阶段 后 生 成 抗 体 记 忆 矩 阵 , 该抗 体记 忆 矩 阵是 由 于抗 原 的入 侵 引起 的 , 其 与入侵 抗 原存 在着 某 种 对 应 映射 关系 , 这 也 就 是 通 常所 说 的抗 体 是抗 原 在 免疫 系统 内的 内映 像 当免疫系 统 再 次遇 到 同 一 抗 原或 类 似 抗 原 的入 侵 时 , 由于 抗 体记 忆矩 阵 的存 在 , 免疫 系 统 迅 速 产 生特 定 的应 答 反 应 , 把 相应 的抗 原 归 为 已 存 在 的类 别 综 上所 述 , 本 文所 提 出 的人 工 免疫 应 答 模 型 具 有 以下特 征 通 过 初 次应 答建 立 抗 体记 忆矩 阵 来 描述 原始数 据 的特 征 通 过 二 次应 答 完 成 对 相 应 数 据 的识 别 在 实 际 计 算 中 , 可 以利 用 它 的上 述特 性 来 实现 数据 压 缩 和 数据 识 别 功 能 人 工 免疫 应 答 模 型 的应 用 在 实 际 生 产 中 , 为 了尽 可 能 反 映 原始 数据 特 征 , 就 尽 量 多 的采 集 样 本 , 这 样 使得 样 本 空 间 急 居 膨胀 , 造 成 所 谓 的 “ 维 数 灾 难 ” 由于 所 采 集 的 数据 相 互 之 间存在 着 一 定 的相 关性 , 有 很 大 的数 据 冗 余 因此 可 以利 用 本文 所提 出 的免 疫应 答模 型 对 这 些 数 据进 行 预 处 理 , 达 到 数 据 压 缩 , 减 少 数 据 冗 余 的 目的 通 过 下 述 实 验 来 实 现 该 模 型 在 数 据 压 缩 和 数 据 识 别 中 的应 用 采 用 两 组 数 据 进 行 数 值 实 验 其 一 是 二 维 空 间 中随 机产 生 的 组 数 据 , 这 些 数据 由 类 组 成 , 每类 含有 组 数据 其 二 是 提 出的 数 据 , 它 由 , , 三 类 每 类 组 共 组 数据 组 成 , 每 组 数 据 分 别 由尊片 的长度 、 曹 片 的 宽度 、 花 瓣 的 长 度 、 花 瓣 的宽度 组 成 定 义数 据 压 缩 率 为 , 图 对 压 缩 率 的 影 响 锌彩︸吹次 , , 图 对 识 别 率的影 响 别月 一万《对 只 式 中汉月 表 示 原 始 数 据 样 本 数 乃才表 示 抗 体 记 忆 矩 阵样 本 数 实验 中先提 取 部 分样本作 为训 练 数据 , 采 用 本 文所提 出的模 型对 其进 行 训 练 学 习 , 以验 证 该 模 型 的数据 压 缩功 能 而 后 把 余 下 的数 据 作 为检 由 图 可 以看 出 , 随着 的增 加 , 抗 体 间相 互 抑制 程度 的增 加 , 使得 生 成 的记 忆矩 阵规 模 迅速 降低 , 数 据 压 缩 率 随 之 不 断增 大 , 即 该 算 法 对 待 所 处 理 数 据 的压 缩 率 与 成 正 比 , 值 越 大 则 压 缩 率越 大 由 图 可 以看 出 , 的取 值 较 小 时对 于 识 别 正 确 率 影 响 不 是 很 明显 但 是 如 果 值 选 取 过 大 , 由于 抗 体记 忆 矩 阵得 到过 度抑 制 , 使 得 产 生 的记 忆 矩 阵损 失 了大 量 的信 息 , 不 能很 好 地描述 原 始 数 据 , 容 易造 成 识 别 结 果 的波 动 , 因此 在 实 际应 用 中要 选 取 适 当 的 值 由 图 和 图 可 以看 出 当 取 时 , 二 维 随机 数 的压缩 率 为 , 识 别 率 为 数 据 的压 缩 率 为 , , 识 别 率 为 系统 具 有较 高 的数 据 压 缩 率 和 数 据 识 别 率 从 数值 实验 结 果 看 , 本 文所 提 出的免疫 应 答 模 型 具 有 很 强 的数 据 压 缩 、 数 据 识 别 能 力 , 可被 广 泛 应 用 于 复杂 数 据 的分析 处 理 过程
Vol.26 No.3 位耀光等:一种人工免疫应答模型的研究及应用 ·325· 4结论 eds.Proceedings of ICARIS 2002:Ist International Con- ference on Artificial Immune Systems [C].University of 基于生物免疫应答机理的人工免疫应答模 Kent,2002 型,通过克隆、变异过程来实现抗体的多样性,使 5 Watkins,Timmis J.Artificial immune recognition system 得所建立的系统具有较好的自适应能力.利用亲 (AIRS):Revisions and refinements [A].Timmis J,Bent- 和力成熟过程完成知识的学习和积累,具有良好 ley P J,eds.Proceedings of ICARIS 2002:1st Interna- 的自学习能力,本文对所提出的算法模型在数据 tional Conference on Artificial Immune Systems [C].Uni- versity of Kent,2002 分析方面的应用进行了研究,结果表明该模型在 6 Timmis J,Neal M,Hunt J.An artificial immune system for 提高数据压缩率和识别率方面具有较好的效果, data analysis [J].Biosystems,2000,55(1/3):143 参考文献 7 de Castro LN,von Zuben F J.aiNet:An artificial immune network for data analysis [A].Abbas H A,Sarker R A, 】郑德玲,梁瑞鑫,付冬梅,等.人工免疫系统及人工 Newton C S,eds.Data Mining:A Heuristic Approach 免疫遗传算法在优化中的应用).北京科技大学学 [M].Idea Group Publishing,2001 报,2003,253):284 8 Watkins A,Boggess L.A new classifier based on resource 2梁瑞鑫,郑德玲,周颗,等,免疫遗传算法在高炉焦 limited artificial immune systems [A].Proceedings of 比目标优化中的应用[A]第二十一届中国控制会议 Congress on Evolutionary Computation.Part of the 2002 论文集[C].杭州,浙江大学出版社,2002:463 IEEE World Congress on Computational Intelligence held 3 Wierzchon S,Kuzelewska U.Stable clusters formation in in Honolulu [C].IEEE,2002 an artificial immune system [A].Timmis J,Bentley P J, 9 Watkins A,Boggess L.A resource limited artificial im- eds,Proceedings of ICARIS 2002:1st International Con- mune classifier [A].Proceedings of Congress on Evolutio- ference on Artificial Immune Systems [C].University of nary Computation.Part of the 2002 IEEE World Congress Kent,2002 on Computational Intelligence held in Honolulu [C]. 4 Marwah G,Boggess L.Artificial immune systems for IEEE,2002 classification:Some issues [A].Timmis J,Bentley P J. Research and Application of Immune Response Model WEI Yaoguang,ZHENG Deling,ZHOU Ying,WANG Ying,FU Dongmei Information Engineering School,University of Science and Technology Beijing,Beijing 100083,China ABSTRACT An artificial immune response model based on biological immune response mechanism was pro- posed,which is made up of four procedures:antigen matching,clone selection,mutation and affinity maturation. The diversity of antibodies,achieved by clone and mutation process,can make the built system possess self-adap- tive capability.Knowledge acquisition results from affinity maturation.The model need few operating parameters and is easy to stable.When applied to data analysis the model has fascinating ability to enhance data compression ratio and data recognition ratio. KEY WORDS artificial immune system;immune response;clone;mutation;data analysis
】 一 位 耀 光 等 一 种 人工 免疫 应 答模型 的研 究及 应 用 一 结 论 基 于 生 物 免 疫 应 答 机 理 的 人 工 免 疫 应 答 模 型 , 通 过 克 隆 、 变异 过 程 来 实现 抗 体 的多样性 , 使 得 所 建 立 的系统 具 有较好 的 自适 应 能力 , 利用 亲 和 力成 熟 过程 完 成 知识 的学 习 和 积 累 , 具 有 良好 的 自学 习 能 力 本 文对 所提 出 的算 法模 型在 数 据 分 析 方 面 的应 用 进 行 了研 究 , 结 果表 明该模 型在 提 高数据 压 缩 率和 识 别 率 方 面 具 有较 好 的效 果 参 考 文 献 郑 德 玲 , 梁 瑞 鑫 , 付 冬 梅 , 等 人 工 免疫 系统 及 人 工 免疫 遗传 算法 在 优 化 中的应用 北 京科技大 学学 报 , , 梁 瑞 鑫 , 郑 德 玲 , 周 颖 , 等 免疫 遗传 算法在 高 炉焦 比 目标优 化 中 的应 用 〔 第 二 十 一 届 中国控制 会议 论 文 集 【 杭 州 , 浙 江 大 学 出版 社 , , , , , , 洲 , 而 , , 班 , 认 , 们。 , , 班 【 枷 , , , 而 , , , 」 , , , 【 , , 匕 , 自 , 』 班曰 , 脚 , 石飞〕 万, 环乞刃 万, , 群 , , , , , , , , 诊