正在加载图片...
VoL.26 No.5 张德政等:基于支持向量机挖据不一致事例隐含的异常信息 ·567· 输出:不一致样例是由于缺少条件属性引 试.发现,2,,山为支持向量,有可能由误差引 起,因而需添加条件属性:如是由于在边界区由 起,可以先进行误差分析.而,6,,4远离两类 误差引起,因而需提高精度, 边界,因此,不一致有可能因缺少属性引起,不用 3.5举例 进行误差分析 给定初始信息表1,其中包含,2:,44:, 对一致信息表中的20个点用SVM分类,支 6;,为四对不一致样本点.先将一致信息进行 持向量为9个,见表2、图3和图4.表中框内点以 支持向量机分类,然后再对不-一致样例进行测 及图中两条虚线之内的点为支持向量. 表1初始信息表(包含,:,4:功,4:4,四对不一致样本点) Table 1 Initial values(Four inconsistent information samples includied) U 1 3 45 6 7 910 U U U U X 0.30.60.80.9 0.80.60.80.9 0.90.8 0.40.4 0.3 0.3 0.9 0.6 0.4 0.5 0.60.90.80.70.8 0.9 0.7 0.7 0.8 0.8 D 1 1 1 1 1 1 I 1 -1 1 -1 U 11 12 13 14 151617 18 1920 UU U U X 0.20.4④0.5☐0.40.30.20.10.10.2 0.10.1 0.10.90.9 人 0.7 0.5 0.10.10.20.30.40.20.2 0.1 0.3 0.3 0.9 0.9 -1 1 -1 -1 -1 -1 -1 -1 -1 -1 -1 1 1 -1 表2一致信息表样本点及其SVM子集 Table 2 Consistent information samples and its SVM subset U 2 3 4 5 6 7 8 9 10 X 0.30.6 0.8 0.90.8 0.60.8 0.9 0.9 0.8 Y 0.9 0.6 0.4 0.5 0.6 0.9 0.8 0.7 0.8 0.9 D 1 1 1 1 1 1 1 U 11 12 1314 15 1617 18 19 20 0.20.40.50.40.3 0.2 0.1 0.1 0.2 0.1 0.7 0.5 0.1 0.1 0.2 0.3 0.4 0.2 0.2 0.1 D -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 1.0 0.8 0.6 l 毫04 0.2 Lo 0 0 0.2 0.4 0.6 0.8 1.0 样本区间 图320个点SVM训练结果(9个支持向量) 图420个样本点的位置 Fig.3 SVM training result of twenty samples Fig.4 Scatter of twenty samples 3.6解决不一致现象可以增加的属性 症时间或长短、发病时刻等 (1)某条件属性的原因或条件.如高烧作为诊 (2)某属性导致的结果.如某项病毒指标会导 断非典型性肺炎的一个条件属性,但它和其他条 致什么后果,如果这些后果不同,也是区分二不 件属性结合并不能确定非典的诊断,那么就增加 一致样例的原因. 条件属性的形成条件或原因作为新的条件属性, (3)那些与约简后主要属性性质较远或相反 例如高烧的起始时间、已发烧的时间、肺部阴影 的属性可能是造成二事例不一致的原因,如二学 的起症时间或肺部阴影的已发生时间、咳嗦的起 生在数理化方面成绩一样,而结论属性一个为张德政 等 基 于 支持 向量机 挖 掘 不 一 致 事例 隐含 的异常信息 输 出 不 一 致 样 例 是 由于 缺 少 条 件 属 性 引 起 , 因而 需添 加 条件 属 性 如 是 由于 在 边 界 区 由 误 差 引起 , 因而 需提 高精 度 举 例 给 定 初 始信 息表 , 其 中包 含 ,, , , 姚 铸 , 为 四对 不 一致样本 点 先将 一 致信 息进 行 支 持 向量 机 分 类 , 然 后 再 对 不 一 致 样 例 进 行 测 试 发 现 , , , 为 支 持 向量 , 有 可 能 由误 差 引 起 , 可 以先 进 行 误 差 分 析 而 “ ,, , ,, 远 离两类 边 界 , 因此 , 不一 致 有 可 能 因缺 少 属性 引起 , 不用 进 行 误 差 分 析 对 一 致 信 息 表 中 的 个 点用 分 类 , 支 持 向量 为 个 , 见表 、 图 和 图 表 中框 内点 以 及 图 中两 条 虚 线 之 内 的点 为支 持 向量 表 初 始 信 息 表 包 含 ,, ,, 一 ,, ,, 价 四 对不 一 致样 本点 川 伊 加 ,, “ 场 , 一 ,, 岭 ,, 酥 队 认 认 区亘口 匡亘口 画国 · 一 一 认 认 匡亘 匡 〕 匡困 匡到 · · · · · · · · 一 一 一 一 一 一 一 一 一 一 一 一 表 一 致 信息 表样 本 点 及 其 子 集 洛 带 带举 卜 图 个 点 训 练 结 果 个 支持 向且 · 恤 幻泞 样 本 区 间 图 个 样本点的位 · 幻即 解 决 不 一 致 现 象 可 以增 加 的属 性 某 条件 属 性 的原 因或 条件 如 高烧 作 为诊 断非 典 型性肺 炎 的一 个 条件 属 性 , 但 它 和 其他 条 件 属性 结合 并不 能确 定 非 典 的诊 断 , 那 么 就 增 加 条件属 性 的形 成 条件 或 原 因作 为新 的条件 属 性 , 例 如 高烧 的起 始 时 间 、 己 发烧 的 时 间 、 肺 部 阴影 的起 症 时 间或肺 部 阴影 的 已 发 生 时 间 、 咳嗦 的起 症 时 间或 长 短 、 发 病 时刻 等 某 属 性 导致 的结 果 如 某 项 病 毒 指标 会 导 致 什 么 后 果 , 如 果这 些 后 果 不 同 , 也 是 区 分 二 不 一 致 样 例 的原 因 那 些 与 约 简后 主 要 属 性性质 较远 或 相 反 的属 性可 能是造 成 二 事例 不 一 致 的原 因 如 二 学 生 在 数 理 化 方 面 成 绩 一 样 , 而 结 论 属 性 一 个 为
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有