正在加载图片...
·324· 北京科技大学学报 2004年第3期 免疫系统通过对所处理数据的训练学习,获 测样本,用以检验其数据识别功能.在实验过程 得抗体记忆矩阵MM=({m,m2,…m;m∈[0,1],i=1, 中,通过逐渐改变抗体抑制域值p的大小,来研 …,z),完成知识的学习和经验的积累.它对后续 究其对数据压缩率和识别正确率的影响.实验结 的由相同或相似的抗原引起的再次应答过程起 果如图1和图2所示, 关键的作用. 100 2.2再次应答 0,003g290a4996* 由于抗原入侵导致免疫系统的应答,免疫细 80. 00 胞经历抗原匹配、克隆选择、变异、亲和力成熟等 米米 阶段后生成抗体记忆矩阵,该抗体记忆矩阵是由 60 米、 一*-lis数据 于抗原的入侵引起的,其与入侵抗原存在着某种 端子 …随机数 对应映射关系,这也就是通常所说的抗体是抗原 40. 在免疫系统内的内映像.当免疫系统再次遇到同 20 一抗原或类似抗原的入侵时,由于抗体记忆矩阵 0.05 0.10 0.15 0.20 的存在,免疫系统迅速产生特定的应答反应,把 p 相应的抗原归为已存在的类别, 图1p对压缩率的影响 综上所述,本文所提出的人工免疫应答模型 Fig.1 Effect of p on compression ratio 具有以下特征:通过初次应答建立抗体记忆矩阵 100 9e0e9906696660o96696e99O90T 来描述原始数据的特征:通过二次应答完成对相 应数据的识别.在实际计算中,可以利用它的上 80 来来 述特性来实现数据压缩和数据识别功能 60 ……随机数 3人工免疫应答模型的应用 -*-lris数据 40 在实际生产中,为了尽可能反映原始数据特 0.05 0.10 0.15 0.20 征,就尽量多的采集样本,这样使得样本空间急 剧膨张,造成所谓的“维数灾难”.由于所采集的 图2p对识别率的影响 数据相互之间存在着一定的相关性,有很大的数 Fig.2 Effect of p on recognition ratio 据冗余.因此可以利用本文所提出的免疫应答模 由图1可以看出,随着p的增加,抗体间相互 型对这些数据进行预处理,达到数据压缩,减少 抑制程度的增加,使得生成的记忆矩阵规模迅速 数据冗余的目的 降低,数据压缩率随之不断增大,即该算法对待 通过下述实验来实现该模型在数据压缩和 所处理数据的压缩率与P成正比,p值越大则压 数据识别中的应用.采用两组数据进行数值实 缩率越大、 验:其一是一维空间中随机产生的210组数据, 由图2可以看出,P的取值较小时对于识别 这些数据由7类组成,每类含有30组数据:其二 正确率影响不是很明显,但是如果P值选取过 是Fisher提出的iris数据,它由setosa,,versicolor,,vir- 大,由于抗体记忆矩阵得到过度抑制,使得产生 ginica三类(每类50组)共150组数据组成,每组 的记忆矩阵损失了大量的信息,不能很好地描述 数据分别由萼片的长度、萼片的宽度、花瓣的长 原始数据,容易造成识别结果的波动,因此在实 度、花瓣的宽度组成 际应用中要选取适当的p值. 定义数据压缩率Cm为: 由图1和图2可以看出:当p取0.1时,二维 C=4-sMx100 S(A) (14) 随机数的压缩率为92.85%,识别率为100%:Iis数 式中,SA)表示原始数据样本数:S)表示抗体 据的压缩率为79167%,识别率为94.4%.系统具 记忆矩阵样本数. 有较高的数据压缩率和数据识别率, 实验中先提取部分样本作为训练数据,采用 从数值实验结果看,本文所提出的免疫应答 本文所提出的模型对其进行训练学习,以验证该 模型具有很强的数据压缩、数据识别能力,可被 模型的数据压缩功能,而后把余下的数据作为检 广泛应用于复杂数据的分析处理过程.北 京 科 技 大 学 学 报 年 第 期 测 样 本 , 用 以检 验 其 数据 识 别 功 能 在 实验 过 程 中 , 通 过 逐 渐 改变 抗 体 抑 制 域值 的大 小 , 来研 究 其对 数据 压缩 率和 识 别 正 确 率 的影 响 实验 结 果 如 图 和 图 所 示 哥涤芝国 免疫 系 统通 过 对 所 处 理 数 据 的训 练 学 习 , 获 得抗 体 记忆矩 阵材伽卜 。 , , … 任「 , 〕 ·, , … , , 完成 知 识 的学 习 和 经 验 的积 累 它 对 后 续 的 由相 同 或 相 似 的抗 原 引起 的再 次 应 答 过 程 起 关 键 的作 用 再 次应 答 由十 抗 原入 侵 导致 免疫 系统 的应 答 , 免 疫 细 胞经 历 抗 原 匹 配 、 克 隆选 择 、 变异 、 亲 和 力成 熟等 阶段 后 生 成 抗 体 记 忆 矩 阵 , 该抗 体记 忆 矩 阵是 由 于抗 原 的入 侵 引起 的 , 其 与入侵 抗 原存 在着 某 种 对 应 映射 关系 , 这 也 就 是 通 常所 说 的抗 体 是抗 原 在 免疫 系统 内的 内映 像 当免疫系 统 再 次遇 到 同 一 抗 原或 类 似 抗 原 的入 侵 时 , 由于 抗 体记 忆矩 阵 的存 在 , 免疫 系 统 迅 速 产 生特 定 的应 答 反 应 , 把 相应 的抗 原 归 为 已 存 在 的类 别 综 上所 述 , 本 文所 提 出 的人 工 免疫 应 答 模 型 具 有 以下特 征 通 过 初 次应 答建 立 抗 体记 忆矩 阵 来 描述 原始数 据 的特 征 通 过 二 次应 答 完 成 对 相 应 数 据 的识 别 在 实 际 计 算 中 , 可 以利 用 它 的上 述特 性 来 实现 数据 压 缩 和 数据 识 别 功 能 人 工 免疫 应 答 模 型 的应 用 在 实 际 生 产 中 , 为 了尽 可 能 反 映 原始 数据 特 征 , 就 尽 量 多 的采 集 样 本 , 这 样 使得 样 本 空 间 急 居 膨胀 , 造 成 所 谓 的 “ 维 数 灾 难 ” 由于 所 采 集 的 数据 相 互 之 间存在 着 一 定 的相 关性 , 有 很 大 的数 据 冗 余 因此 可 以利 用 本文 所提 出 的免 疫应 答模 型 对 这 些 数 据进 行 预 处 理 , 达 到 数 据 压 缩 , 减 少 数 据 冗 余 的 目的 通 过 下 述 实 验 来 实 现 该 模 型 在 数 据 压 缩 和 数 据 识 别 中 的应 用 采 用 两 组 数 据 进 行 数 值 实 验 其 一 是 二 维 空 间 中随 机产 生 的 组 数 据 , 这 些 数据 由 类 组 成 , 每类 含有 组 数据 其 二 是 提 出的 数 据 , 它 由 , , 三 类 每 类 组 共 组 数据 组 成 , 每 组 数 据 分 别 由尊片 的长度 、 曹 片 的 宽度 、 花 瓣 的 长 度 、 花 瓣 的宽度 组 成 定 义数 据 压 缩 率 为 , 图 对 压 缩 率 的 影 响 锌彩︸吹次 , , 图 对 识 别 率的影 响 别月 一万《对 只 式 中汉月 表 示 原 始 数 据 样 本 数 乃才表 示 抗 体 记 忆 矩 阵样 本 数 实验 中先提 取 部 分样本作 为训 练 数据 , 采 用 本 文所提 出的模 型对 其进 行 训 练 学 习 , 以验 证 该 模 型 的数据 压 缩功 能 而 后 把 余 下 的数 据 作 为检 由 图 可 以看 出 , 随着 的增 加 , 抗 体 间相 互 抑制 程度 的增 加 , 使得 生 成 的记 忆矩 阵规 模 迅速 降低 , 数 据 压 缩 率 随 之 不 断增 大 , 即 该 算 法 对 待 所 处 理 数 据 的压 缩 率 与 成 正 比 , 值 越 大 则 压 缩 率越 大 由 图 可 以看 出 , 的取 值 较 小 时对 于 识 别 正 确 率 影 响 不 是 很 明显 但 是 如 果 值 选 取 过 大 , 由于 抗 体记 忆 矩 阵得 到过 度抑 制 , 使 得 产 生 的记 忆 矩 阵损 失 了大 量 的信 息 , 不 能很 好 地描述 原 始 数 据 , 容 易造 成 识 别 结 果 的波 动 , 因此 在 实 际应 用 中要 选 取 适 当 的 值 由 图 和 图 可 以看 出 当 取 时 , 二 维 随机 数 的压缩 率 为 , 识 别 率 为 数 据 的压 缩 率 为 , , 识 别 率 为 系统 具 有较 高 的数 据 压 缩 率 和 数 据 识 别 率 从 数值 实验 结 果 看 , 本 文所 提 出的免疫 应 答 模 型 具 有 很 强 的数 据 压 缩 、 数 据 识 别 能 力 , 可被 广 泛 应 用 于 复杂 数 据 的分析 处 理 过程
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有