D0I:10.13374/i.issn1001-053x.2001.03.001 第26卷第3期 北京科技大学学报 Vol.26 No.3 2004年6月 Journal of University of Science and Technology Beijing Jun.2004 基于GA和FCM的岩体结构面的 混合聚类方法 王鹏”赵学亮”万林海》蔡美峰》 1)北京科技大学土木与环境工程学院,北京1000832)北京北大方正电子有限公司,北京100085 3)华北水利水电学院,郑州450008 摘要提出了一种基于遗传算法(GA)和模糊C均值(FCM)算法的岩体结构面混合案类方 法.利用GA的全局搜索性能,求得初始聚类中心:在此基础上利用FCM算法,根据精度要求 再作进一步求解.该方法避免了人为划定分类界限的主观性,消除了FCM聚类算法的局部最 优的弱点,解决了采用普通遗传算法聚类时搜索速度和聚类精度的矛盾.结合实测数据,对 应用该方法进行结构面组识别的步骤、参数选取、分组有效性、优势方位的判定进行了分析 和讨论, 关键词岩体;结构面;模糊C均值算法;遗传算法 分类号P642 对岩体结构面参数进行实地测量和统计分起来,构造了一种新的岩体结构面混合聚类方 析,以期获得结构面特征及其组合分布规律,是 法.首先利用GA的全局搜索性能,求得初始聚 进行岩体工程稳定性分析和计算的基础. 类中心,此阶段对精度不作过高要求,只要得到 结构面成因的复杂性决定其分布既有一定 的聚类中心位于最优解的吸引域即可;然后再利 的规律同时也具有不确定性和不精确性.为了分 用FCM算法,根据精度要求进一步求解.这样就 析结构面发育的规律性,通常将具有某些共同特 能解决FCM算法局部最优的缺陷和GA进化后 征的结构面归类,最为常见的是按结构面产状进 期的计算效率低的问题 行分组和确定优势方位,Shanley和Mahtab于 1FCM聚类算法 1976年首次提出了结构面产状的聚类算法川,后 由Mahtab等人发展了用于结构面识别的模糊C 按结构面产状进行聚类分析,通常将描述结 均值(FCM)聚类算法.FCM聚类算法模糊化处 构面产状的倾向(或走向)、倾角作为聚类分析的 理能较准确地反映数据的实际分布,与传统极点 统计指标.为了便于分析比较,首先需将各代表 图、等密度图方法相比有了较大的改进,但它本 点的统计指标进行数据标准化.良好的标准化方 质是一种局部搜索寻优法. 法,在实现量纲为1化的同时,还应该保持原有 模糊聚类问题实际上是一个典型的组合优 各统计指标的分辨力,即变异性的大小,采用结 化问题,而遗传算法(GA)作为一种自适应全局 构面的法向向量作为统计指标.由于样本特征为 优化概率搜索算法提供了一种求解复杂系统 单位向量,无需进行坐标单位的线性变换.由于 优化问题的通用框架.研究表明,在GA群体 欧氏距离具有旋转不变的特性,故本文采用欧式 进化的不同阶段,当前最优解质量的提高程度不 距离度量结构面相似程度. 同5. 结构面模糊聚类问题可表示为下面的数学 本文基于这种思想,将FCM算法与GA结合 规划问题: min/(ua)lX-Va (1) 收稿日期200309-23王鹏男,28岁,博士研究生 -IH *国家“十五”科技攻关计划课题(No.2001BA609A-08) s.twt=1,1≤k≤n
第 卷 第 期 年 月 北 京 科 技 大 学 学 报 让 。 基于 和 的岩体结构面 的 混合聚类方法 王 鹏 ‘, 赵 学亮 ” 万 林 海 ” 蔡 美峰 ‘, 北 京科 技大 学 土木 与环 境 工程 学 院 , 北 京 北 京 北大 方 正 电子有 限 公 司 , 北京 华北 水利水 电学 院 , 郑州 摘 要 提 出 了一 种 基 于 遗传 算法 和 模糊 均 值 算法 的岩 体结构面 混 合聚 类 方 法 利用 的全局 搜索性 能 , 求得初 始 聚 类 中心 在此 基础 上 利 用 算 法 , 根据 精度 要 求 再 作进 一 步求解 该 方 法避 免 了人 为划 定 分类 界 限 的主 观 性 , 消除 了 聚类算 法 的局 部 最 优 的弱 点 , 解 决 了采用 普通遗 传 算法 聚类 时搜索速度和 聚类精度 的矛 盾 结合 实测 数据 , 对 应 用 该 方 法进 行 结构面组 识 别 的步骤 、 参 数选 取 、 分组 有效性 、 优势方位 的判定进行 了分析 和 讨论 关键 词 岩体 结构 面 模糊 均 值算法 遗 传 算法 分 类号 对 岩 体 结 构 面 参 数 进 行 实地 测 量 和 统 计 分 析 , 以期 获 得 结 构 面特 征 及 其 组 合 分 布 规 律 , 是 进 行 岩 体 工 程 稳 定 性 分 析 和 计 算 的基 础 结 构 面 成 因 的复 杂 性 决 定 其 分 布 既 有 一 定 的规 律 同时也 具 有 不确 定性和 不精 确性 为 了分 析 结 构 面 发育 的规 律性 , 通 常将 具 有 某 些 共 同特 征 的结构 面 归类 , 最 为 常 见 的是 按 结 构 面产 状进 行 分 组 和 确 定 优 势 方 位 和 于 年 首 次提 出 了结构 面 产 状 的聚 类 算法 ‘ , 后 由 等 人 发 展 了用 于 结 构 面 识 别 的模糊 均 值 聚类 算 法‘, 聚 类 算 法 模 糊 化 处 理 能较准确地 反 映数 据 的实 际分布 , 与传 统极 点 图 、 等 密 度 图方 法 相 比有 了较 大 的改进 , 但 它 本 质 是 一 种 局 部 搜 索 寻 优 法 模 糊 聚 类 问题 实 际上 是 一 个 典 型 的组 合 优 化 问题 , 而 遗 传 算 法 作 为一 种 自适 应 全 局 优 化 概 率 搜 索 算 法 提 供 了 一 种 求 解 复 杂 系 统 优 化 问题 的通 用框 架 砂, 研 究表 明 , 在 群 体 进 化 的不 同阶 段 , 当前 最 优 解质 量 的提 高程 度 不 同 ‘ , 本 文 基 于 这 种 思想 , 将 算 法 与 结合 起 来 , 构 造 了一 种 新 的岩 体 结 构 面 混 合 聚 类 方 法 首 先 利 用 的全 局 搜 索 性 能 , 求 得初 始 聚 类 中心 , 此 阶段 对 精度 不 作 过 高要 求 , 只 要 得 到 的聚类 中心 位 于 最优解 的吸 引域 即可 然 后 再 利 用 算法 , 根 据 精度 要 求 进 一 步求解 这 样 就 能解 决 算 法 局 部 最 优 的缺 陷和 进 化 后 期 的计 算 效 率 低 的 问题 聚 类算法 按 结 构 面 产 状 进 行 聚 类 分 析 , 通 常将描 述 结 构面 产状 的倾 向 或 走 向 、 倾 角作 为聚 类 分析 的 统 计 指标 为 了便 于 分 析 比较 , 首 先 需将 各代 表 点 的统计 指 标进 行数据 标准 化 良好 的标准化 方 法 , 在 实现 量 纲 为 化 的 同 时 , 还 应 该 保 持 原 有 各 统 计 指 标 的分 辨 力 , 即变 异 性 的大 小 采 用 结 构面 的法 向向量 作 为统计 指 标 由于 样 本特 征 为 单位 向量 , 无 需进 行 坐 标 单位 的线性变换 由于 欧 氏距 离具 有旋 转不 变 的特 性 , 故本 文采 用 欧式 距 离度 量 结 构 面 相 似 程 度 口, 结 构 面 模 糊 聚 类 问题 可 表 示 为 下 面 的 数 学 规 划 问题 收稿 日期 一 一 王 鹏 男 , 岁 , 博 士 研 究生 国家 “ 十 五 ” 科技攻关 计 划课题 一 艺 刁叫风 一 川 , 艺 ‘ , ‘ ‘ , DOI :10.13374/j .issn1001-053x.2004.03.001
·228· 北京科技大学学报 2004年第3期 0≤4t≤1,1≤i≤c;1≤k≤n, 通过交叉、变异等运算产生.在每一代中用适应 0<∑ua<n,1≤isc. 值来度量个体的优劣,在新一代个体形成过程 FI 这里,X={X,X,…X,}CR,为三维实数空间R中 中,根据适应值的大小选择部分后代,同时淘汰 的一个有限样本,即n个样本数据子集:K= 部分后代,从而保持种群数量M不变.这样经过 (x,xa,xa)ER为样本特征矢量,即第k个结构面 若干代后,算法收敛于最优的个体 的法向向量,取大地坐标NEZ时,值由下式确定: 21适应度函数 X=(cosa sin3,sina sinB.,cosf)(=l,2,…,n)(2) 遗传算法中,以个体适应度的大小来确定该 式中,,B.分别表示第k个结构面的倾向、倾角. 个体被遗传到下一代群体中的概率.对个体适应 X:-KlF=(-v) (3) 度的计算,考虑到FCM聚类算法的目标函数值 在定义域内均为非负数,优化目标是求函数的最 式中,V,=(v,va,va)为聚类中心;m∈[1,∞)为模糊 小值,故可对目标函数做如下转换, 加权指数:4:表示第k个样本X隶属于聚类C,的 min max(-J) (6) 程度,且满足Wu∈0,]和∑wa=1. 即 F=-J (7) 当X≠V时,有: F为种群适应度函数, x户x, 2.2染色体编码 1≤isc,1≤k≤n (4) 对于一些多维、高精度要求的函数优化问 (u)X 题,如果使用二进制编码,当个体编码串长度较 V=E 1sisc (5) 短时,可能达不到精度要求:个体编码串的长度 E(u)" 较长时,又会使GA的搜索空间急剧扩大.而采 模糊加权指数m控制着隶属度的分配和聚 用浮点编码不仅改善了GA的计算复杂性,提高 类的模糊程度,关于m值选取,已有若干文献进 运算效率,同时便于GA与FCM的混合使用, 行过讨论,但大多为经验或实验结论.文献[8]利 根据c个P维聚类中心的各维坐标值的取值 用模糊决策理论提出了一种模糊C均值聚类算 范围,将其真值编码成基因串b={B…B…P,},其 法中加权指数m的优选方法,并经实验验证了一 中g=c×p,b中前p个值代表第一个p维聚类中心, 般情况下m的最佳取值范围为[1.5,2.5],一般情 第+1到2p个值代表第二个p维聚类中心,依次类 况下取折衷方案m=2.模糊C均值聚类算法通 推例.对应结构面聚类问题,p一3. 过对目标函数迭代优化方法来实现的.通过上述 2.3遗传算子 模糊C均值聚类算法,目标函数最终将收敛到 选择操作可采用轮盘赌法、基于归一化的优 一个局部极小点或鞍点,从而得到X的一个模糊 先选择法、竞争选择法中一种,交叉算子可同时 C-划分. 使用简单交叉算子、算术交叉算子、混合交叉算 在进行目标函数J的迭代时,初始聚类中心 子一种或几种.变异算子亦可同时使用单重均匀 的选择和样本的输入次序对最终聚类结果有着 变异算子、单重边界变异算子和单重非均匀变异 很大的影响.如果初始分类严重偏离全局最优分 算子中的一种或几种. 类时,该算法将很可能陷入局部极小点:当数据 2.4终止操作 量较大,特别是在高维情况下,表现尤为突出.经 遗传算法是一个反复迭代的过程,遗传算法 常采用的对策是用若干不同的初始聚类中心分 的终止条件,可利用某种判定准则.可采用的判 别进行聚类,然后选择最满意的一个作为最终聚 定准则主要有规定最大的迭代次数,规定最小的 类结果.这种方法用于结构面产状的数据分析, 偏差和观察适应度的变化趋势三种, 不仅工作量大,且不能保证聚类结果的最优性, 2遗传算法(GA) 3结构面的混合聚类方法流程 遗传算法的运算基础是字符串,它从一组随 混合聚类方法可分为两阶段实现.第1阶段: 机产生的种群的初始解开始搜索过程,种群中的 1)给定类别数c,群体大小M,交叉概率P,变异概 每个个体对应问题的一个解.后代个体由前一代 率Pm和终止代数Tm:2)令T-1,初始化c个聚类中
窃 北 京 科 技 大 学 学 报 年 第 期 ‘ 法‘ , ‘ ‘ ‘ ‘ , 艺 , ‘ ‘ 这 里 , ,戈 , … , 牙 , 为三 维 实数 空 间牙 中 的 一 个 有 限 样 本 , 即 个 样 本 数 据 子 集 再 二 ,, 翔 , 翔阵 为样 本特 征 矢 量 , 即第 个 结 构 面 的法 向 向量 , 取 大 地 坐 标 时 , 值 由下 式确 定 叭 , 叭 , 卿 , , … , 式 中 , ,几 分 别 表 示 第 个 结 构 面 的倾 向 、 倾 角 氏一 州 , 一 艺 ,一 , 式 中 , 鱿 , 珠 , 儿 为 聚 类 中 心 任 【 , 二 为 模 糊 加 权 指数 街表 示第 个样 本 戈 隶属 于 聚类 的 程度 , 且 满足 琉粼 , 和 艺 ‘ 当戈羊 时 , 有 、裔 奋 、尚 一 , 娇 们〕丁二不平 户 开 二下平 , 了了、 以︸ 、、了了‘ 三 三 , 三 性 艺 刁 用 戈 卜 全 , 。 三 三 模 糊 加权 指 数 控 制着 隶属 度 的分 配 和 聚 类 的模 糊 程 度 关 于 值选 取 , 已 有 若 干 文 献 进 行 过 讨 论 , 但 大 多 为 经 验 或 实 验 结 论 文 献 【 利 用 模糊 决策 理 论 提 出 了一 种 模 糊 均 值 聚 类 算 法 中加 权 指数 的优选 方 法 , 并经 实验 验 证 了一 般情 况 下 的最 佳 取 值 范 围为 【 , , 一 般 情 况 下 取 折 衷 方 案 , 模 糊 均值 聚 类 算 法 通 过 对 目标 函 数迭代 优 化 方 法 来 实现 的 通 过 上 述 模 糊 均 值 聚类 算 法 , 目标 函 数最 终 将 收 敛 到 一 个 局 部 极 小 点或 鞍 点 , 从 而 得到 的一 个模 糊 一 划 分 在 进 行 目标 函 数几 的迭 代 时 , 初 始 聚 类 中心 的选 择 和 样 本 的输 入 次 序 对 最 终 聚 类 结 果 有 着 很 大 的影 响 如 果 初 始 分 类 严 重偏 离全 局 最优 分 类 时 , 该 算 法 将 很 可 能 陷入 局 部 极 小 点 当数 据 量 较 大 , 特 别 是在 高维情 况 下 , 表 现 尤 为 突 出 经 常 采 用 的对 策 是 用 若 干 不 同 的初 始 聚 类 中心 分 别 进 行 聚类 , 然 后 选择 最 满 意 的一 个 作 为最 终 聚 类 结 果 这 种 方 法 用 于 结 构 面 产 状 的数据 分 析 , 不 仅 工 作 量 大 , 且 不 能保 证 聚 类 结 果 的最 优 性 遗传 算法 遗传 算 法 的运 算基 础 是 字 符 串 , 它 从 一 组 随 机 产 生 的种 群 的初 始解 开 始搜 索过 程 , 种 群 中 的 每个 个体对 应 问题 的一 个 解 后 代个 体 由前 一 代 通 过 交 叉 、 变 异 等 运 算 产 生 在 每 一 代 中用 适 应 值 来度 量 个 体 的优 劣 , 在 新 一 代 个 体 形 成 过 程 中 , 根 据 适 应 值 的大 小选 择 部 分 后 代 , 同 时淘 汰 部 分 后 代 , 从 而 保 持 种 群 数 量 不 变 , 这 样 经 过 若 干 代 后 , 算 法 收敛 于 最 优 的个 体 适 应 度 函 数 遗传 算 法 中 , 以个 体适应 度 的大 小来确 定 该 个 体被遗传 到 下 一 代群 体 中 的概 率 对个 体适应 度 的计 算 , 考 虑 到 聚 类 算 法 的 目标 函数 值 在 定 义域 内均 为 非 负数 , 优 化 目标 是求 函数 的最 小值 , 故 可 对 目标 函数 做 如 下 转换 二 一几 即 一大 为种 群 适 应 度 函 数 染 色 体 编 码 对 于 一 些 多维 、 高 精 度 要 求 的 函 数优 化 问 题 , 如 果 使 用 二 进 制 编 码 , 当个 体 编 码 串长 度 较 短 时 , 可 能达 不 到 精 度 要 求 个 体 编 码 串 的长 度 较 长 时 , 又 会 使 的搜 索 空 间急剧 扩 大 而 采 用 浮 点编 码 不 仅 改善 了 的计 算 复杂性 , 提 高 运 算 效率 , 同时便 于 与 的混 合 使用 根 据 个 维 聚 类 中心 的各 维 坐 标 值 的取 值 范 围 , 将 其 真 值 编 码 成 基 因 串 伊 , … 八… 几 , 其 中 , 中前尸个值 代表 第 一 个尸维聚类 中心 , 第 到 个值代表 第 二 个尸维聚类 中心 , 依 次类 推 四, 对 应 结 构 面 聚 类 问题 , 遗传 算 子 选 择 操 作 可采 用 轮 盘 赌 法 、 基 于 归一 化 的优 先 选 择 法 、 竞 争选 择 法 中一 种 交叉 算子 可 同 时 使 用 简单 交 叉 算 子 、 算术 交叉 算 子 、 混 合 交叉 算 子 一种 或 几 种 变异 算 子亦 可 同时使用 单重均 匀 变 异 算子 、 单 重边 界变异 算 子和 单重 非均匀变 异 算 子 中的一 种 或 几 种 终 止 操 作 遗 传 算 法 是 一 个 反 复 迭 代 的过 程 , 遗 传 算 法 的终 止 条件 , 可 利 用 某 种 判 定准 则 可 采 用 的判 定 准 则主 要 有规 定最 大 的迭代 次数 , 规 定最 小 的 偏 差 和 观 察 适 应度 的变 化 趋 势三 种 结构 面 的 混 合 聚 类方 法 流 程 混 合 聚类 方 法 可 分 为两 阶段 实现 第 阶段 给 定类 别 数 , 群 体 大 小, 交叉 概 率 。 , 变 异 概 率夕 , 和 终 止 代 数 令 , 初 始 化 个 聚 类 中
Vol.26 No.3 王鹏等:基于GA和FCM的岩体结构面的混合聚类方法 ·229· 心V(T)(1≤i≤c),并对其进行编码,形成初始种 E(u)(X-V)(X-V) 群;3)对每个聚类中心,分别计算隶属度4: F,= 1≤i≤c. 2(u (1≤i≤c,1≤k≤n,Jm,适应度F:4)依次执行复制、 最优模糊划分应对应最小模糊超体积F和最大 交叉、突变,产生下一代种群:5)令T=T+1,直至达 平均划分密度P 到终止条件,选择最佳个体作为遗传算法的 结果. 42结构面分组及优势方位的确定 在上述计算过程中,每个个体经过交叉、变 按上述计算方法经聚类有效性检验,即可得 到合适的结构面分组数c.每组均代表了所在地 异等操作,随机产生的新个体可能由于违背约束 段的优势结构面,聚类中心则代表了该组优势结 而不可行,对于结构面聚类的数学规划问题,由 构面的平均法向向量.根据式(2)即可换算为平 于采用结构面的法向向量作为统计指标,实际上 均产状.同时,各组中样本量的大小亦可反映优 还隐含着一个约束条件,即进化过程中所产生个 势结构面重要性的不同. 体必须分别满足单位向量的条件.本文采用可行 解变换法来处理, 5实例 第2阶段:6)给定一个常数>0,置迭代次数 水厂铁矿是目前我国生产规模最大的变质 =0,以第一阶段得出的聚类中心为初始聚类中 岩型露天磁铁矿床之一,随着不断向深部开拓, 心;7)根据,按式(4)计算U,8)根据式(5)得 边坡稳定性的研究和评价工作变得越来越重要, 到下一次聚类中心";9)如果‖w-<6,结 而边坡岩体中结构面的数量、规模、产状和分布 束.否则k=+1,返回7). 规律的研究是进行边坡破坏模式的分析和稳定 由于该混合聚类方法计算过程较为复杂,为 性评价的基础.本次采用详细线测量的方法,共 便于工程应用,编制了相应的计算程序RJGF. 布置地表测线30条,每条测线长度为10-30m,测 4聚类有效性检验和优势方位的 得2349组节理面产状数据. 现以水厂铁矿北采场两处实测节理数据为 确定 基础,验证本方法的有效性和可靠性,下面分两 4.1聚类有效性检验 种情况来研究.基于GA和FCM的混合聚类算法 运行设置参数如下:m=2,M-100,p=0.4,p=0.06, 由聚类有效性可知,好的聚类结果应为尽可 能明晰的划分剧,到目前为止,已提出了多种聚 T.w=100,FCM算法最终迭代误差e=10. 类有效性准则.由于采用单一的指标难以最优聚 1)节理极点等密度图具有良好的可识别性 类结果进行判断,因而有必要采用多项指标进行 取D248点进行分析.图1为D248点节理统计的 极点图和等密度图.从图中可以直观的发现该点 聚类效果检验,.可选用的指标包括分类熵指标 有两组优势节理面. H和模糊分类系数Fm;对于采用欧氏距离的R 空间,聚类效果评价指标还有模糊超体积F及 用基于GA和FCM的混合聚类算法对D248 平均划分密度p,其计算公式分别如下,回: 点进行节理产状分组.由图2可见,各项聚类有 H.(U.c)=-ualog.(ua) 效性指标均表明聚类数c取2时,聚类效果最佳. nir (8) 图3和图4分别表示D248点节理混合聚类两阶 r.u,q=122G (9) 段计算过程.根据聚类中心计算结果知该点优势 n 式中,对数的底数a∈(1,+∞),且约定当W:=0时有 结构面平均产状分别是48.44°∠71.28°,295.18°∠ wlog.(u)=0,本文取自然对数.Hm值愈接近0, 37.00°.与根据节理等密度图所做出的直观判断 F。值愈接近1,则表明分类的模糊性越小,聚类效 是一致的. 果越好 2)节理极点等密度图各分组边界不明显,以 F E[det(F)] D256H点为例,图5为D256H点极点图和等密度 (10) 1 图.从图中可以发现,优势节理组之间的界限并 )deiCF (11) 不明显, 式中,F,称为模糊协方差矩阵, 用基于GA和FCM的混合聚类算法对D256H
王 鹏等 基于 和 的岩体 结构 面 的 混 合 聚 类方法 一 心 叱 力 ‘ ‘ , 并对 其 进 行 编 码 , 形 成 初 始 种 群 对 每 个 聚 类 中 心 , 分 别 计 算 隶 属 度 碗 ‘ 达 , ‘ ‘ ,大 , 适 应 度 依 次执 行 复制 、 交叉 、 突变 , 产 生下 一代 种群 令 介 , 直至 达 到 终 止 条 件 , 选 择 最 佳 个 体 作 为 遗 传 算 法 的 结 果 在 上 述 计 算 过程 中 , 每 个 个 体 经 过 交 叉 、 变 异 等操 作 , 随机 产 生 的新 个体可 能 由于 违 背 约束 而 不 可 行 , 对 于 结构 面 聚类 的数 学 规 划 问题 , 由 于采用 结构面 的法 向 向量 作 为统计 指标 , 实际上 还 隐含着一 个 约束 条件 , 即进化 过程 中所产 生个 体必 须 分 别满足 单位 向量 的条件 本 文采 用可 行 解 变换 法 来 处 理‘ 第 阶 段 给 定一 个 常 数沙 , 置 迭 代 次数 , 以第 一 阶段 得 出 的聚 类 中心 为初 始聚 类 中 心 材 。, 根 据 材 , 按 式 计 算 少 根 据 式 得 到 下 一 次聚类 中心 砂 如 果 尸川,一 砂 勺 , 结 束 否 则 , 返 回 由于 该 混 合 聚 类 方 法 计 算过 程 较 为 复 杂 , 为 便 于 工程 应 用 ,编制 了相应 的计 算程 序 艺 护氏一 均氏一 玲 双 三 一 - , ‘ ‘ 艺 办 ’ 最 优 模 糊 划 分 应 对 应 最 小 模 糊 超 体积 和 最 大 平 均 划 分 密 度凡 结构 面 分 组 及 优 势方 位 的确 定 按 上 述计 算 方 法 经 聚类有 效 性检 验 , 即可 得 到 合 适 的结构 面 分 组 数 每 组 均 代 表 了所 在 地 段 的优 势 结构面 , 聚类 中心 则代 表 了该 组优势 结 构 面 的平 均 法 向 向量 根据 式 即可 换 算 为平 均 产状 同时 , 各 组 中样 本 量 的大 小 亦 可 反 映优 势 结构面 重 要 性 的不 同 聚 类有 效 性检 验 和 优 势方 位 的 确定 聚 类有效 性检验 由聚 类 有 效性 可 知 , 好 的聚类结 果 应 为尽 可 能 明 晰 的划 分 『, , 到 目前 为 止 , 已 提 出 了多种 聚 类 有 效性 准 则 由于采用 单一 的指 标难 以最 优聚 类 结果进行 判 断 , 因而 有必 要采用 多项 指标进行 聚 类 效果 检验‘圳 可 选 用 的指标 包 括 分 类嫡 指 标 和 模 糊 分 类系数 对 于 采 用 欧 氏距 离 的牙 空 间 , 聚类 效 果 评 价 指 标 还 有 模糊 超 体 积 及 平 均 划 分 密 度 , 其 计 算 公 式 分 别 如 下〔,’, ,卜 一姑蓦 · , ,,一 姑 硫 式 中 , 对 数 的底 数 创 , , 且 约 定 当 , 时有 · 以 , 本 文 取 自然 对 数 值 愈 接 近 , 值 愈接近 , 则表 明分类 的模糊性越 小 , 聚类 效 果 越 好 一 全 £ 」令 几 一 鹊办 一 、 式 中 , 双 称 为模 糊 协 方 差 矩 阵 , 实例 水 厂 铁 矿 是 目前 我 国 生 产 规 模最 大 的变 质 岩 型 露天 磁 铁矿 床 之 一 , 随着 不 断 向深 部 开 拓 , 边 坡稳 定 性 的研 究和 评 价 工 作变 得越来越 重 要 而 边 坡 岩 体 中结 构 面 的数 量 、 规 模 、 产 状 和 分 布 规 律 的研 究 是 进 行 边 坡 破 坏模 式 的分 析 和 稳 定 性 评 价 的基 础 本 次采 用详 细 线测 量 的方 法 , 共 布 置 地表 测 线 条 , 每 条测 线 长度 为 一 , 测 得 组 节 理 面 产状 数据 现 以水 厂 铁 矿 北 采 场 两 处 实 测 节 理 数 据 为 基础 , 验 证 本 方 法 的有 效性 和 可 靠 性 下 面 分 两 种情 况 来研 究 基 于 和 的混 合 聚 类 算法 运 行 设 置 参 数如 下 二 , 彻卜 , 户 ,介 , , 算法 最 终 迭 代 误 差二 ‘ 节 理 极 点 等密 度 图具 有 良好 的可 识 别 性 取 点进 行 分析 图 为 点节 理 统 计 的 极 点 图和 等密 度 图 从 图 中可 以直观 的发现 该 点 有 两 组 优 势节 理 面 用 基 于 和 的混 合 聚 类算法 对 点进 行 节 理 产状 分 组 由 图 可 见 , 各 项 聚 类 有 效性 指 标均 表 明聚类 数 。 取 时 , 聚 类 效果 最 佳 图 和 图 分 别表 示 点节 理 混 合 聚 类 两 阶 段 计 算 过程 根据 聚 类 中心 计 算 结果 知 该 点优 势 结 构 面 平 均 产 状 分 别 是 乙 , 艺 与 根据 节 理 等 密 度 图所 做 出 的直 观 判 断 是 一 致 的 节 理 极 点 等密 度 图各分 组 边 界 不 明显 以 点 为 例 , 图 为 点极 点 图和 等密 度 图 从 图 中可 以发现 , 优 势节 理 组 之 间 的界 限并 不 明显 用 基 于 和 的混 合 聚 类 算法 对 、 、护 了、 八︶ 产、 , 曰几 几 、产少 ‘ 了
◆230· 北京科技 大学学报 2004年第3期 生n便E 学 W E g 图1D248点节理极点图和等密度图 Fig.1 Pole and contour plots of joints at D248 1.0 0.8 a (b) 0.7 0.9 0.6 0.5 0.8 0.7 02 0.6 0.1 1.6 (c) 105 (d) 1.4 % · 1.2 85 人 1.0 75 0.8 65 56 56 分类数c 分类数c 图2D248点节理聚类有效性指标与分类数的关系曲线 Fig.2 Plots of the values of cluster validity against the number of clusters of joints at D248 -10 10.9 10.8 -20 10.7 -30 10.6 图 蛔 一最大适应值 10.5 40 一平均适应值 食 10.4 -50 10.3 0102030405060708090100 1 2 34 5 6 进化代数T 迭代次数k 图3第一阶段GA进化过程图 图4第二阶段FCM目标函数变化曲线 Fig.3 Evolutionary process of GA Fig.4 Objective function of FCM cluster algorithm 点进行节理产状分组.由图6可见,除分类熵指 判指标的理由所在.图7和图8分别表示D256H 标Hm外,其余各项指标均表明分类数取5时,聚 点节理混合聚类两阶段计算过程,根据聚类中心 类效果最佳.实际上由图6(b)可见,分类数取5时 计算结果可知该点优势结构面平均产状分别是 的分类熵指标H。仅略大于分类数取2和4时的 131.12°∠49.19°,305.00°∠35.15°,231.46°∠84.66°, 指标值,可见取5类是合理的,这也是取多项评 31.99°∠76.53°,197.62°∠36.38°
北 京 科 技 大 学 学 报 年 第 期 图 点 节理 极点 图和 等 密度 图 · 嫂默求苗 仪 林丽﹂陌 娜粼舞畸求戴心 扁求骊除侧却心 ,‘ 娜罪彩耸裂时 吧一一一一一 一一一 一一一』 一一一以一一一一二一一一一上 耳 分类 数 分类数 图 点 节理 聚 类有效性指 标 与分 类数 的关 系 曲线 妇 , ,八曰 ︸ 一 最大适应值 一 平均适应值 黛划象皿讨图 进化代数 图 第一 阶段 进化过程 图 到 迭代次数 图 第二 阶段 目标 函数变化 曲线 · “抖让日川曰日州“州”尸 月 侧喇恻叭 点进 行 节 理 产状 分 组 由图 可 见 , 除分类嫡 指 标 外 , 其 余各 项 指标 均表 明分类 数取 时 , 聚 类 效果最佳 实际上 由图 可见 , 分类数 取 时 的分 类 嫡 指 标凡 仅 略大 于 分类 数 取 和 时 的 指 标值 可 见 取 类 是 合 理 的 , 这 也 是 取 多 项 评 判指标 的理 由所 在 图 和 图 分别 表 示 点节 理混 合 聚类 两 阶段 计算过程 根据 聚类 中心 计 算结果 可 知 该 点 优 势 结 构 面 平均产 状 分别 是 , 之 , 艺 , 艺 “ , , 艺
Vol.26 No.3 王鹏等:基于GA和FCM的岩体结构面的混合聚类方法 ◆231 心 N U使H归 器 W 2. 图5D256H点节理极点图和等密度图 Fig.5 Pole and contour plots of joints at D256H 0.76 (a) 0.60 (b) 0.74 0.56 0.72 0.52 0.70 0.48 0.68 0.44 1.50 110 (c) (d) 106 1.40 102 1.35 1.30 1.2 2 % 3 56 1 3 4 5 6 7 分类数c 分类数c 图6D256H点节理聚类有效性指标与分类数的关系曲线 Fig.6 Plots of the values of cluster validity against the number of clusters of joints at D256H 6.74 8 6 -12 6.70 6.68 -16 姿 6.66 人 一最大适应值 -20 6.64 一平均适应值 6.62 -24 0 6.60 20 40 60 80 100 2 34 5 6 进化代数T 选代次数k 图7第一阶段GA进化过程图 图8第二阶段FCM目标函数变化曲线 Fig.7 Evolutionary process of GA Fig.8 Objective function of FCM cluster algorithm 6结语 解决了FCM聚类算法的易陷入局部最优和GA 进化后期的计算效率低的弱点,可以不依靠工程 (1)借鉴现代人工智能的某些研究成果,提出 经验给出客观可靠的结果, 了一种基于GA和FCM的岩体结构面混合聚类 (2)编制了相应计算程序,采用数据文件的管 算法,避免了优势结构面组分类界限不明显和先 理方式,使应用该方法分析大量数据十分方便. 验知识不足情况下人为划定分类界限的主观性, (3)结合现场实测数据,对该方法进行结构面
‘ 王 鹏 等 基 于 和 的岩体结构 面 的 混合聚 类 方法 一 图 点节 理 极点 图和 等 密度 图 褚 · 卜 继绷睽眯奚众公 一 侧知求幕河除考 ﹂口区雨 彩攀裂纂缪时 分类数 分类数 图 点节理 聚类有 效性指标 与分 类数 的 关 系 曲线 , ‘‘ 乙 ︵ 恻鉴粼血嘴阁 -最大适应值 -平均适应值 书朋 划侧啊叫 进 化代数 图 第一 阶 段 进 化 过 程 图 · 叮 结 语 借 鉴现代 人 工 智 能 的某 些研 究成 果 , 提 出 了一 种 基 于 和 的岩 体 结构面 混 合 聚 类 算法 , 避 免 了优 势 结构 面 组 分类 界 限不 明显 和 先 验知 识 不足情况 下人 为划 定分类 界 限的主观 性 , 迭代 次数 图 第二 阶 段 目标 函 数 变化 曲线 讨 解 决 了 聚类 算法 的 易 陷入 局 部 最 优 和 进 化 后 期 的计算 效率低 的弱 点 , 可 以不 依靠 工程 经 验 给 出客 观 可 靠 的结果 编制 了相应 计 算程 序 , 采 用 数据 文件 的管 理 方 式 , 使 应用 该 方法 分析 大量 数据 十 分 方 便 结合现场 实测数据 , 对 该方法进 行 结构 面
·232· 北京科技大学学报 2004年第3期 组识别的具体步骤以及参数选取、分组有效性、 5李敏强,寇纪淞,林丹等.遗传算法的基本理论与应 优势方位判定的分析和讨论表明,该方法是进行 用M1.北京:科学出版社,2002 岩体结构面聚类分析的一种有效方法 6 Goldberg DE.Genetic algorithms in search,optimization and machine learning [M].MA:Addison-Wesley Publish- 参考文献 ing Company,1989 1 Shanley R J,Mahtab M A.Delineation and analysis of 7赵奎,蔡美峰.模糊C均值聚类算法在结构面组识 clusters in orientation data[J].J Math Geol,1976,8(3):9 别中的应用[U.金属矿山,2002(1):13 2 Mahtab MA,Yegulalp T M.A rejection criterion for defi- 8高新波,李洁,谢维信.模糊C均值聚类算法中参数 nition of clusters in orientation data [A].Goodman R E, m的优选[.模式识别与人工智能,2000,13(1):7 Heuze F E,eds.Issues in Rock Mechanics,Proceedings of 9刘健庄,谢维信,黄建军等.聚类分析的遗传算法方 the 22nd Symposium on Rock Mechanics [C].American 法[.电子学报,1995,23(11):81 Institute of Mining Metallurgy and Petroleum Engineers, 10周明,孙树栋编著.遗传算法原理及应用M).北京: 1982,116 国防工业出版社,1999 3 Hammah R E,Curran J H.Fuzzy cluster algorithm for the 11 Bezdek J C.Pattern Recognition with Fuzzy Objective automatic identification of joint sets [J].Int J Rock Mech Function Algorithms [M.New York:Plenum Press,1981 Min Sci,.1998,35(7):889 12 Gath I,Geva A B.Unsupervised optimal fuzzy clustering 4 Holland JH.Adaptation in Natural and Artificial Systems [J].IEEE Trans Pattern Anal Mach Intell,1998,11(7):773 [M].The University of Michigan Press,1975 Hybrid Cluster Analysis Method Based on GA and FCM for Automatically Iden- tifying Joint Sets WANG Peng",ZHAO Xueliang,WAN Linhat,CAI Meifeng 1)Civil and Environmental Engineering School,University of Science and Technology Beijing,Beijing 100083,China 2)Beijing Founder Electronics Co,Ltd.,Beijing 100085,China 3)North China Institute of Water Conservancy and Hydroelectric Power,Zhengzhou 450008,China ABSTRACT A hybrid cluster analysis method based on genetic algorithm(GA)and fuzzy C-means(FCM)al- gorithm is introduced for the automatic identification of joint sets.The initial cluster centers for FCM are obtained by GA,and then the optimal cluster results can be calculated by FCM on the basis of the work in the first stage.This method eliminates the local optimality disadvantage of FCM and the subjectivity of traditional methods such as pole and contour plots for classifying joints into sets and resolves the conflict between search speed and cluster precision by general GA,The analysis steps,parameters selection,cluster validity and dominant direction determination for identification of joints sets using the hybrid cluster analysis method are discussed based on joint survey data sets. KEY WORDS rock mass;joint;fuzzy C-means cluster analysis method;genetic algorithm
北 京 科 组 识 别 的具 体 步骤 以及 参 数选 取 、 分 组 有 效 性 、 优 势方位判 定 的分 析 和 讨 论 表 明 , 该方法 是进行 岩体 结 构 面 聚 类 分 析 的一 种有 效 方 法 参 考 文 献 , 加 妙 【 , , , 皿 , , 耐 , 【 , , , 乙卿 刀 , , , 技 大 学 学 报 年 第 期 李敏强 , 寇 纪 淞 , 林丹 等 遗传 算 法 的基本 理 论与应 用 【 」北 京 科 学 出版 社 , , , 一 , 赵奎 , 蔡美峰 模糊 均值聚类算法在结构面组 识 别 中的应用 金 属矿 山 , 高新波 , 李 洁 , 谢 维信 模糊 均值聚类算法 中参 数 的优 选 模式 识别 与人 工 智 能 , , 刘健 庄 , 谢维信 , 黄建军等 , 聚类分 析 的遗传 算法 方 法 电子 学报 , , 周 明 , 孙树栋 编 著 遗传算法 原 理及应用 北 京 国防工 业 出版社 , 乙刁 , , 石牙 【 , , 沙 删 , 月义口 心气环月万 己 毋 助 钊 , , , 吨 , , , 认 , , 一 任 加 , 妙 加 勿 , , 田叭 , 理 一