工程科学学报,第37卷,第6期:693699,2015年6月 Chinese Journal of Engineering,Vol.37,No.6:693-699,June 2015 D0l:10.13374/j.issn2095-9389.2015.06.003:http://journals.ustb.edu.cn 基于模糊C均值聚类和图形技术的结构面产状分析 方法 修国林”,李国清区,彭康2),王泽伟》,刘志祥 1)北京科技大学土木与环境工程学院,北京1000832)重庆大学煤矿灾害动力学与控制国家重点实验室,重庆400044 3)中南大学资源与安全工程学院,长沙410083 ☒通信作者,E-mail:qqlee@usth.edu.cn 摘要针对传统的利用极点等密度图和玫瑰图的结构面分组方法主观性强和聚类分析方法不够直观的缺点,建议利用模 糊C均值(FC)聚类的隶属度的结果,结合图形技术绘制隶属度等值线图来进行结构面分组.隶属度等值线图充分利用了 模糊C均值聚类中隶属度的信息,展现每个聚类的隶属度的空间分布规律,并且可以分辨出因随机因素形成的结构面,还可 以直观地读出聚类中心的范围.三山岛金矿的实例证明,该方法同时具有传统方法直观和聚类分析方法客观的优点,并且能 够适应优势组不明显的数据. 关键词结构面:模糊聚类:图形技术;等值线图 分类号TD853.3 FCM and graphics technique based method for discontinuities occurrence analysis XIU Guo-in,LI Guo-qing,PENG Kang),WANG Ze-wei),LIU Zhi-xiang 1)School of Civil and Environmental Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)State key Laboratory of Coal Mine Disaster Dynamics and Control,Chongqing University,Chongqing 400044,China 3)School of Resources and Safety Engineering,Central South University,Changsha 410083,China Corresponding author,E-mail:qqlee@ustb.edu.cn ABSTRACT To solve the disadvantages of strong subjectivity for traditional plot methods of grouping discontinuities,such as the pole isodensity map and the occurrence rose graph,and the lack of intuitionism for popular clustering methods,this article introduces a plot method called the membership contour map.Based on the data of the membership matrix obtained through the fuzzy C-mean (FCM)algorithm,the membership contour map is realized by a graphics technique.Due to the full use of membership information in FCM clustering,the membership contour map can show the spatial distribution of the membership degree of each clustering,distin- guish discontinuities caused by trivial random factors,and read out clustering centers by the scope form from the membership contour map directly.An application of Sanshandao Gold Mine proves that the membership contour map holds the advantages of both intuition- ism and objectivity,and can adapt discontinuities data,which do not have obvious dominant groups. KEY WORDS discontinuities:fuzzy clustering:graphics technique:contour plots 岩体由岩块和结构面两部分组成,其中岩体结构具有渗透结构面的岩体的渗透系数往往比完整岩石大 面对岩体的整体力学性质起到控制作用,是导致岩体几个数量级.岩体结构面的调查与数据处理是岩体工 力学性质不均匀,各向异性的主要原因.连通的具有 程中基础且琐碎的工作,其中对结构面的产状进行分 渗透性的结构面对岩体的水力学特征更是至关重要, 组是一项必不可少的工作. 收稿日期:2014-02-23 基金项目:国家自然科学基金资助项目(41372278,51374244)
工程科学学报,第 37 卷,第 6 期:693--699,2015 年 6 月 Chinese Journal of Engineering,Vol. 37,No. 6: 693--699,June 2015 DOI: 10. 13374 /j. issn2095--9389. 2015. 06. 003; http: / /journals. ustb. edu. cn 基于模糊 C 均值聚类和图形技术的结构面产状分析 方法 修国林1) ,李国清1) ,彭 康2,3) ,王泽伟3) ,刘志祥3) 1) 北京科技大学土木与环境工程学院,北京 100083 2) 重庆大学煤矿灾害动力学与控制国家重点实验室,重庆 400044 3) 中南大学资源与安全工程学院,长沙 410083 通信作者,E-mail: qqlee@ ustb. edu. cn 摘 要 针对传统的利用极点等密度图和玫瑰图的结构面分组方法主观性强和聚类分析方法不够直观的缺点,建议利用模 糊 C 均值(FCM)聚类的隶属度的结果,结合图形技术绘制隶属度等值线图来进行结构面分组. 隶属度等值线图充分利用了 模糊 C 均值聚类中隶属度的信息,展现每个聚类的隶属度的空间分布规律,并且可以分辨出因随机因素形成的结构面,还可 以直观地读出聚类中心的范围. 三山岛金矿的实例证明,该方法同时具有传统方法直观和聚类分析方法客观的优点,并且能 够适应优势组不明显的数据. 关键词 结构面; 模糊聚类; 图形技术; 等值线图 分类号 TD853. 3 FCM and graphics technique based method for discontinuities occurrence analysis XIU Guo-lin1) ,LI Guo-qing1) ,PENG Kang2,3) ,WANG Ze-wei 3) ,LIU Zhi-xiang3) 1) School of Civil and Environmental Engineering,University of Science and Technology Beijing,Beijing 100083,China 2) State key Laboratory of Coal Mine Disaster Dynamics and Control,Chongqing University,Chongqing 400044,China 3) School of Resources and Safety Engineering,Central South University,Changsha 410083,China Corresponding author,E-mail: qqlee@ ustb. edu. cn ABSTRACT To solve the disadvantages of strong subjectivity for traditional plot methods of grouping discontinuities,such as the pole isodensity map and the occurrence rose graph,and the lack of intuitionism for popular clustering methods,this article introduces a plot method called the membership contour map. Based on the data of the membership matrix obtained through the fuzzy C-mean (FCM) algorithm,the membership contour map is realized by a graphics technique. Due to the full use of membership information in FCM clustering,the membership contour map can show the spatial distribution of the membership degree of each clustering,distinguish discontinuities caused by trivial random factors,and read out clustering centers by the scope form from the membership contour map directly. An application of Sanshandao Gold Mine proves that the membership contour map holds the advantages of both intuitionism and objectivity,and can adapt discontinuities data,which do not have obvious dominant groups. KEY WORDS discontinuities; fuzzy clustering; graphics technique; contour plots 收稿日期: 2014--02--23 基金项目: 国家自然科学基金资助项目(41372278,51374244) 岩体由岩块和结构面两部分组成,其中岩体结构 面对岩体的整体力学性质起到控制作用,是导致岩体 力学性质不均匀,各向异性的主要原因. 连通的具有 渗透性的结构面对岩体的水力学特征更是至关重要, 具有渗透结构面的岩体的渗透系数往往比完整岩石大 几个数量级. 岩体结构面的调查与数据处理是岩体工 程中基础且琐碎的工作,其中对结构面的产状进行分 组是一项必不可少的工作.
·694* 工程科学学报,第37卷,第6期 传统的结构面分组方法有极点等密度图田、走向 据具有显著的相似性,不同的类之间的数据具有明显 玫瑰图和倾向玫瑰图等,这些利用图形描述结构面产 的差异性m.聚类分析是寻找数据间的内在联系的 状的方法简单直观,一目了然.但是,正如很多文献中 有力工具,根据数据是否被确定地分到某一类,聚类分 指出的,这些方法只能得到一个粗略的分组数,优势组 析可以分为硬聚类(严格聚类)或软聚类(模糊聚类) 的产状的确定因人而异,经验成分较大.因此,多 两种:硬聚类技术包括最常见的分层凝聚法、K均值动 元统计理论中的聚类分析法被大量提出以获得客观的 态聚类法、局部优化聚类法、蚁群聚类算法等:软聚类 分组,消除优势组判别过程中的主观性.在已经提出 技术中最常用的是由Ruspini☒提出,经Dunn图和 的结构面聚类法中主要分为两类:一类是所谓的硬聚 Bezdek4-改进和发展的模糊C均值聚类法.模糊C 类技术,例如邓继辉等同利用自组织聚类算法,卢波 均值聚类法能给出每个数据对于各个类的隶属度,因 等圆将产状数据转换为多目标规划并用小生境Pareto 此能够比硬聚类法提供更多的信息.另外,空间结构 遗传算法求解,徐必根等圆采用层次凝聚法,李继明网 面的相似度度量问题和模糊C均值求解是聚类分析 的K均值聚类法等;另一类是以模糊C均值(fuzzy 的前提,下面将分别介绍 C-mean,FCM)算法为代表的软聚类技术,例如周玉新 1.1空间结构面的相似度量 等圆给出的综合模糊聚类分析,蔡美峰和王鹏等,习 结构面可以假定为空间上的平面,可以用倾向 给出的用遗传算法求解的模糊C均值聚类,宋金龙 (a)和倾角(B)简单地表示为a∠B,其中0°≤&≤ 等给出的用粒子群算法求解的模糊C均值聚类,滕 360°,0°≤B≤90°.空间上的平面还可以用该平面的 继东等给出的利用蚁群算法求解的模糊C均值聚 单位法向量n来唯一地表示,n=(cosasinB,sinasinB, 类.然而,以上提到的聚类技术中不管是硬聚类还是 cosB).利用距离函数来度量两个结构面之间的相似 软聚类,目的都是给出每一个结构面数据的划分,最后 性:距离越大相似性越差;反之,距离越小相似性越好 得到一个确切的聚类中心. 记两个结构面i和j的距离函数为D(i,),这个距离准 事实上,具体到某一个结构面数据,我们其实并不 则需要满足对称性、非负性和自等性,即满足D(i,》= 关心其具体归属,而是关心优势组的范围.极点等密 D(Gi,),D(i,)≥0,D(i,i)=0 度图可以很直观地指出大致的优势组范围:但是对于 结构面之间的距离准则有很多,例如卢波等四采 优势组并不明显的数据,极点等密度图并不能很好地 用结构面法向量的夹角的正弦值的平方,李继明直 区别各个组间的界限,导致辨认困难.由此,本文结合 接采用结构面法向量所夹的锐角作为距离,蔡美峰 模糊C均值聚类技术和图形处理技术,提出了隶属度 等回利用单位法向量的欧氏距离作为距离准则.本文 等值线图的绘制方法.该方法同时具有传统方法(例 采用结构面单位法向量的球面距离作为距离准则,该 如极点等密度图法)直观的优点和聚类分析法客观的 准则不仅满足上文所述的距离的要求,而且具有明确 优点,同时克服了极点等密度图分组不清的缺点 的几何意义,如图1所示,将两个结构面的单位法向量 的起点移至单位球的球心处,两个向量的终点在单位 1 模糊聚类技术 球上的球面距离即为衡量两个结构面相似水平的距 聚类分析是一种将大量的无序的数据根据数据间 离,下文简称球面距离.该距离在文献[5]中也被使 的相似性划分为若干个类的技术,同一个类之间的数 用.球面距离的表达式如下: D(i,)=2 arcsin In:-nl 2 2arcsin 2 /(cosa,sinB.-cosa,sinp,)'+(sina,sin明.-sina,sinB,)2+(cosβ.-cosp,)2 (1) 1.2模糊C均值聚类 隶属度矩阵表示U=(ug)wx,其中“g为0和1之间的 考虑一组无序的数据样本X=(x,x2,…,xx), 值,代表第i个结构面对于第j个模糊类的隶属程度, x:∈R,其中V为数据个数,f为每组数据的维数,在本 数值越大代表隶属程度越高,并满足名 ug=1.模糊 文中X为结构面的集合,N为测得的结构面的个数,每 个结构面的产状可以用倾向和倾角两个值表示,因此∫ C均值聚类的目的是求解下面的优化问题: 为2. Mia(u.wm=名三a,号 (2) 模糊C均值算法的目的是将结构面数据X分为 C∈{2,3,…,N-1}个模糊类,每个模糊类可以用该类 .L.g∈D,1](i=1,2,…,Nj=1,2,…,C),(3) 的中心w,(0=1,2,…,C)来表示.聚类的结果可以用 三4,=1i=120. (4)
工程科学学报,第 37 卷,第 6 期 传统的结构面分组方法有极点等密度图[1]、走向 玫瑰图和倾向玫瑰图等,这些利用图形描述结构面产 状的方法简单直观,一目了然. 但是,正如很多文献中 指出的,这些方法只能得到一个粗略的分组数,优势组 的产状的确定因人而异,经验成分较大[2--4]. 因此,多 元统计理论中的聚类分析法被大量提出以获得客观的 分组,消除优势组判别过程中的主观性. 在已经提出 的结构面聚类法中主要分为两类:一类是所谓的硬聚 类技术,例如邓继辉等[5]利用自组织聚类算法,卢波 等[3]将产状数据转换为多目标规划并用小生境 Pareto 遗传算法求解,徐必根等[6]采用层次凝聚法,李继明[7] 的 K 均值聚类法等;另一类是以模糊 C 均 值( fuzzy C-mean,FCM)算法为代表的软聚类技术,例如周玉新 等[8]给出的综合模糊聚类分析,蔡美峰和王鹏等[2,9] 给出的用遗传算法求解的模糊 C 均值聚类,宋金龙 等[4]给出的用粒子群算法求解的模糊 C 均值聚类,滕 继东等[10]给出的利用蚁群算法求解的模糊 C 均值聚 类. 然而,以上提到的聚类技术中不管是硬聚类还是 软聚类,目的都是给出每一个结构面数据的划分,最后 得到一个确切的聚类中心. 事实上,具体到某一个结构面数据,我们其实并不 关心其具体归属,而是关心优势组的范围. 极点等密 度图可以很直观地指出大致的优势组范围;但是对于 优势组并不明显的数据,极点等密度图并不能很好地 区别各个组间的界限,导致辨认困难. 由此,本文结合 模糊 C 均值聚类技术和图形处理技术,提出了隶属度 等值线图的绘制方法. 该方法同时具有传统方法(例 如极点等密度图法)直观的优点和聚类分析法客观的 优点,同时克服了极点等密度图分组不清的缺点. 1 模糊聚类技术 聚类分析是一种将大量的无序的数据根据数据间 的相似性划分为若干个类的技术,同一个类之间的数 据具有显著的相似性,不同的类之间的数据具有明显 的差异性[11]. 聚类分析是寻找数据间的内在联系的 有力工具,根据数据是否被确定地分到某一类,聚类分 析可以分为硬聚类(严格聚类)或软聚类(模糊聚类) 两种:硬聚类技术包括最常见的分层凝聚法、K 均值动 态聚类法、局部优化聚类法、蚁群聚类算法等;软聚类 技术中最常用 的 是 由 Ruspini [12] 提 出,经 Dunn [13] 和 Bezdek [14--15]改进和发展的模糊 C 均值聚类法. 模糊 C 均值聚类法能给出每个数据对于各个类的隶属度,因 此能够比硬聚类法提供更多的信息. 另外,空间结构 面的相似度度量问题和模糊 C 均值求解是聚类分析 的前提,下面将分别介绍. 1. 1 空间结构面的相似度量 结构面可以假定为空间上的平面,可 以 用 倾 向 (α) 和倾角( β) 简单地表示为 α∠β,其中 0° ≤α≤ 360°,0°≤β≤90°. 空间上的平面还可以用该平面的 单位法向量 n 来唯一地表示,n = ( cosαsinβ,sinαsinβ, cosβ). 利用距离函数来度量两个结构面之间的相似 性:距离越大相似性越差;反之,距离越小相似性越好. 记两个结构面 i 和 j 的距离函数为 D(i,j),这个距离准 则需要满足对称性、非负性和自等性,即满足D(i,j) = D(j,i),D(i,j)≥0,D(i,i) = 0. 结构面之间的距离准则有很多,例如卢波等[3]采 用结构面法向量的夹角的正弦值的平方,李继明[7]直 接采用结构面法向量所夹的锐角作为距离,蔡美峰 等[2]利用单位法向量的欧氏距离作为距离准则. 本文 采用结构面单位法向量的球面距离作为距离准则,该 准则不仅满足上文所述的距离的要求,而且具有明确 的几何意义,如图 1 所示,将两个结构面的单位法向量 的起点移至单位球的球心处,两个向量的终点在单位 球上的球面距离即为衡量两个结构面相似水平的距 离,下文简称球面距离. 该距离在文献[5]中也被使 用. 球面距离的表达式如下: D(i,j) ( = 2arcsin | ni - nj | ) 2 = [ 2arcsin 1 2 (cosαisinβi - cosαj sinβj )2 + (sinαisinβi - sinαj sinβj )2 槡 + (cosβi - cosβj ) ] 2 . (1) 1. 2 模糊 C 均值聚类 考虑一组无序的数据样本 X = ( x1,x2,…,xN ), xi∈Rf ,其中 N 为数据个数,f 为每组数据的维数,在本 文中 X 为结构面的集合,N 为测得的结构面的个数,每 个结构面的产状可以用倾向和倾角两个值表示,因此 f 为 2. 模糊 C 均值算法的目的是将结构面数据 X 分为 C∈{2,3,…,N - 1}个模糊类,每个模糊类可以用该类 的中心 wj (j = 1,2,…,C)来表示. 聚类的结果可以用 隶属度矩阵表示 U = (uij ) N × c,其中 uij为 0 和 1 之间的 值,代表第 i 个结构面对于第 j 个模糊类的隶属程度, 数值越大代表隶属程度越高,并满足 ∑ C j = 1 uij = 1. 模糊 C 均值聚类的目的是求解下面的优化问题: MinJFCM (U,W) = ∑ C j = 1 ∑ N i = 1 (uij ) m d2 ij , (2) s. t. uij∈[0,1](i = 1,2,…,N;j = 1,2,…,C),(3) ∑ C j = 1 uij = 1 (i = 1,2,…,N). (4) ·694·
修国林等:基于模糊C均值聚类和图形技术的结构面产状分析方法 ·695 (2)~式(4)所示的优化问题,例如粒子群算法田、遗 传算法P,9和蚁群算法@,这些算法都具有被广泛认 D(i.n 同的全局优化能力,但是这些方法的使用过程中没有 用到目标函数的导数信息,并且在使用过程中需要反 复尝试和调节一些特定的参数,例如粒子群算法中的 粒子数和惯性权重,这使得这些算法都有计算量过大 的缺陷.因此,式(5)~式(8)的方法仍然是最实用的 方法,可以通过改变几次初始聚类中心的方法增加算 法的稳定性 2模糊C均值聚类结果的处理方法 图1结构面法向量球面距离示意图 Fig.I Schematic diagram of discontinuity normal vector spherical 2.1聚类中心的计算 distance 由式(3)和式(4)可以看到,每一个结构面将一个 总隶属度1分配给了C个类,因此聚类中心应该以加 其中U为隶属度矩阵,W为聚类中心w,构成的向量, 权平均的方式表示.式(8)给出了一种加权的聚类中 d,=D(x,心,),m∈,+o)为控制模糊度的参数,当 心的计算方法,该式考虑了每一个结构面数据对某个 m=1时问题退化为硬聚类方法.m的取值对模糊C 聚类的贡献.实际上,很多结构面与某个聚类实际上 均值聚类的效果影响很大,Pal和Bezdek从聚类有 相去甚远,但是在式(8)中仍然计算了这些结构面的 效性角度得出m的取值为.5,2.5],本文参考前人 贡献.为了克服这个缺点,本文给出了一个考虑隶属 的经验2.,取m的值为2. 度阙值的聚类中心的计算方法: 式(2)~式(4)表示的是一个有约束优化问题,利 ∑(ug)"x: 用拉格朗日乘子技术可以将这个有约束优化问题转换 (G=1,2,…,C). (9) 为无约束优化问题.引入N个拉格朗日乘子A={入1, ∑(u)m 入2,…,Av},构造一个新的目标函数F(U,W,A), 式中T为隶属度阈值,数值取0和1之间.式(9)在计 F(U,W,A)JrcM (U,W)+ 三(,- 算聚类中心时只考虑隶属度大于T的结构面而忽略隶 属度小于T的结构面的贡献.当T取0时式(9)与式 (5) (8)是等同的. 以式(5)为目标函数的无约束优化问题与原来的 2.2隶属度等值线图绘制 有约束优化问题的解相同.一旦聚类中心确定,通过 结构面i的赤平投影坐标(x,y:)与j类的隶属度 式(6)的解可以求得“的表达式(7) u可以构成数据组(x,y,u),N个结构面的数据组构 aF(U,W,0=0(i=1,2,…,Nj=1,2,…,C), 成了j类在赤平投影上的隶属度空间分布,为了充分 ou 展示这种隶属度的空间分布规律,可以采用类似于极 (6) 点等密度图的图形展示技术,直观地表现大量的信息 1 (i=1,2,…,N=1,2,…,C) 隶属度等值线图的画法其实就是一般的等值线图 问题,可以借助一些专门的图形软件(例如本文采用 (7) surferl1)实现,也可借助于一些具有较强图形能力的 然而聚类中心是预先未知的,这个问题可以通过 数学软件(例如Mathematica)为平台编程实现.具体 迭代技术来解决,即将上一个迭代步的聚类中心作为 实现步骤如下: 本次迭代“预先确定”的聚类中心,在本次迭代完成时 ①对于聚类,构成N个数据点(x,y4),i=1, 2,…,N: 利用式(8)更新聚类中心,当聚类中心的改变量小于 某个足够小的数(例如0.000001)时,认为计算收敛, ②利用软件构成Delaunay网格,对空间进行 插值: 迭代结束 ③绘制i类的等值线图: ∑(u)x ④将C个聚类的等值线图绘制于同一张图中,隐 W= (G=1,2,…,C) (8) 去隶属度小于T的部分,即为综合隶属度等值线图. ∑(u写)" 一方面,模糊C均值聚类的结果中每一类的隶属 另外,许多学者将一些智能算法应用到求解式 度分布总是显示出“单峰”的特点,即越靠近聚类中心
修国林等: 基于模糊 C 均值聚类和图形技术的结构面产状分析方法 图 1 结构面法向量球面距离示意图 Fig. 1 Schematic diagram of discontinuity normal vector spherical distance 其中 U 为隶属度矩阵,W 为聚类中心 wj 构成的向量, dij = D(xi,wj ),m∈[1,+ ∞ )为控制模糊度的参数,当 m = 1 时问题退化为硬聚类方法. m 的取值对模糊 C 均值聚类的效果影响很大,Pal 和 Bezdek [16]从聚类有 效性角度得出 m 的取值为[1. 5,2. 5],本文参考前人 的经验[2,4],取 m 的值为 2. 式(2) ~ 式(4)表示的是一个有约束优化问题,利 用拉格朗日乘子技术可以将这个有约束优化问题转换 为无约束优化问题. 引入 N 个拉格朗日乘子 Λ = {λ1, λ2,…,λN },构造一个新的目标函数 F(U,W,Λ), F(U,W,Λ) = JFCM (U,W) + ∑ N i = 1 λi ( ∑ C j = 1 uij ) - 1 . (5) 以式(5)为目标函数的无约束优化问题与原来的 有约束优化问题的解相同. 一旦聚类中心确定,通过 式(6)的解可以求得 uij的表达式(7). F(U,W,Λ) uij = 0 (i = 1,2,…,N;j = 1,2,…,C), (6) uij = 1 ∑ C k = ( 1 dij d ) ik 2 m-1 (i = 1,2,…,N;j = 1,2,…,C). (7) 然而聚类中心是预先未知的,这个问题可以通过 迭代技术来解决,即将上一个迭代步的聚类中心作为 本次迭代“预先确定”的聚类中心,在本次迭代完成时 利用式(8) 更新聚类中心,当聚类中心的改变量小于 某个足够小的数(例如 0. 000 001)时,认为计算收敛, 迭代结束. wj = ∑ N i = 1 (uij ) m xi ∑ N i = 1 (uij ) m (j = 1,2,…,C). (8) 另外,许多学者将一些智能算法应用到求解式 (2) ~ 式(4)所示的优化问题,例如粒子群算法[4]、遗 传算法[2,9]和蚁群算法[10],这些算法都具有被广泛认 同的全局优化能力,但是这些方法的使用过程中没有 用到目标函数的导数信息,并且在使用过程中需要反 复尝试和调节一些特定的参数,例如粒子群算法中的 粒子数和惯性权重,这使得这些算法都有计算量过大 的缺陷. 因此,式(5) ~ 式(8)的方法仍然是最实用的 方法,可以通过改变几次初始聚类中心的方法增加算 法的稳定性. 2 模糊 C 均值聚类结果的处理方法 2. 1 聚类中心的计算 由式(3)和式(4)可以看到,每一个结构面将一个 总隶属度 1 分配给了 C 个类,因此聚类中心应该以加 权平均的方式表示. 式(8)给出了一种加权的聚类中 心的计算方法,该式考虑了每一个结构面数据对某个 聚类的贡献. 实际上,很多结构面与某个聚类实际上 相去甚远,但是在式(8) 中仍然计算了这些结构面的 贡献. 为了克服这个缺点,本文给出了一个考虑隶属 度阈值的聚类中心的计算方法: wj = ∑uij ≥T (uij ) m xi ∑uij ≥T (uij ) m (j = 1,2,…,C). (9) 式中 T 为隶属度阈值,数值取 0 和 1 之间. 式(9)在计 算聚类中心时只考虑隶属度大于 T 的结构面而忽略隶 属度小于 T 的结构面的贡献. 当 T 取 0 时式(9)与式 (8)是等同的. 2. 2 隶属度等值线图绘制 结构面 i 的赤平投影坐标( xi,yi )与 j 类的隶属度 uij可以构成数据组(xi,yi,uij ),N 个结构面的数据组构 成了 j 类在赤平投影上的隶属度空间分布,为了充分 展示这种隶属度的空间分布规律,可以采用类似于极 点等密度图的图形展示技术,直观地表现大量的信息. 隶属度等值线图的画法其实就是一般的等值线图 问题,可以借助一些专门的图形软件(例如本文采用 surfer11)实现,也可借助于一些具有较强图形能力的 数学软件(例如 Mathematica) 为平台编程实现. 具体 实现步骤如下: ① 对于聚类 j,构成 N 个数据点(xi,yi,uij),i = 1, 2,…,N; ② 利 用 软 件 构 成 Delaunay 网 格,对 空 间 进 行 插值; ③ 绘制 j 类的等值线图; ④ 将 C 个聚类的等值线图绘制于同一张图中,隐 去隶属度小于 T 的部分,即为综合隶属度等值线图. 一方面,模糊 C 均值聚类的结果中每一类的隶属 度分布总是显示出“单峰”的特点,即越靠近聚类中心 ·695·
·696* 工程科学学报,第37卷,第6期 隶属度越大:另一方面,隶属度满足式(4)的性质,只 上测得的结构面为例,实测数据含有350个结构面 要将阈值T定为一个较大的值(比如0.5),综合隶属 图2给出了350个结构面的极点等密度图、倾向玫瑰 度等值线图总是能显示出类与类之间有明显的界限, 图和倾角玫瑰图(以Mathematica为平台自编程序 这克服了极点等密度图难以区分不同分组的缺点. SPCD实现,画法参照文献D],本文中采用上半球投 影).由图可以看到这组数据优势组不明显,从传统 3 工程应用 的方法中难以区分优势组,难以获得准确的优势组 以三山岛金矿-105m中段巷道内裸露的岩壁 中心 (a) 303403500102030 3303403500 102030 (e) 320 0 32 40 310° 50 31 50° 300 60 20330s340350°0°1020300 290% 709 290 70° 50 280 80° 280 80o 300 60° r270° 90°EW270 90rE290° 70° 260 100° 260 100°280 80° 250 110° 250 110° 120 270° g0° 240° 240 230° 130 120 220° 140° 230° 130° w 220° 图2-105m结构面极点等密度图(a)、倾向玫瑰图(b)和走向玫瑰图(c) Fig.2 Pole isodensity map (a),dip direction rose diagram (b)and trend rose diagram (c)of discontinuities in the -105 m leve 实测结构面分布较为分散,结合极点等密度图的 上文的方法,经过模糊C均值聚类分析,计算聚类中 观察确定分组数为四组,破碎岩体常采用3~4组分 心见表1,绘制每个类的隶属度等值线图见图3,绘制 组,因为过多的分组并不利于工程实际的应用.利用 综合隶属度等值线图见图4. 表1CM聚类中心计算 Table 1 Cluster centers of FCM clustering T=0 T=0.5 T=0.75 T=0.9 传统方法(极点等密度图) 聚类 倾向/() 倾角/() 倾向/()倾角/() 倾向/()倾角/() 倾向/()倾角/() 领向/() 倾角/() CI 287.1 64.8 295 雪 293.2 66.8 289.8 67.2 275~320 60-70 C2 69.3 65.3 61.2 66.9 64.4 66.9 65.9 63.8 80~105 50~75 C3 140.1 60.2 140.3 61.2 140.6 61.6 141.1 62.3 135~170 55-65 C4 203.3 59.9 203.9 61.8 206.6 62.0 205.1 61.1 从表1看到,利用模糊聚类方法可以定量得到的 为聚类中心的标准,C1类的中心范围为倾向275°~ 聚类中心,采用不同的阈值计算的聚类中心相差不超 298°,倾角52°-75°:C2类中心范围为倾向55°~78°, 过5°,远远小于利用极点等密度图产生的主观误差, 倾角55°~75:C3类的中心范围为倾向133°~147°, 稳定性较好,因此选取不同的T值都是合适的.从图3 倾角53°~67°:C4类的中心范围为倾向195°~215°, 可以清楚地看出每一个类的隶属度的空间变化,而且 倾角51·~65°.聚类中心以范围的形式表示比确切的 每一个类的隶属度向聚类中心凝聚,单峰性质明显,证 单一数值更具实际意义. 明聚类取得了很好的效果.图4是图3的综合显示, 对比传统方法(图2(a)和本文方法(图4),可以 通过定义显示的范围可以很明确地划分出类与类之间 发现这两种方法所得的结果有所差别:表1优势结构 的界限(白色部分),很直观地分辨出每个结构面所属 面显示,传统方法判别优势结构面范围笼统,并且没有 的类,同时还可以分辨出那些分类不明确的结构面 判别出倾角210°方向优势组:除此之外,另外三个优 (图中白色区域内的结构面).这些结构面很有可能是 势组两种方法吻合较好.关于这点可以解释如下:① 一些次要的随机因素形成的,这是传统方法和硬聚类 本文例子中的数据较为分散,优势组之间界限不明,导 方法不能实现的.另外,还可以从图4中直观地读出 致极点等密度图等值线的数值保持在较低的水平 每个类的聚类中心的范围.例如,若以隶属度为0.95 (1%~3%),这降低了优势组的判别的可靠性,增强
工程科学学报,第 37 卷,第 6 期 隶属度越大;另一方面,隶属度满足式(4)的性质,只 要将阈值 T 定为一个较大的值(比如 0. 5),综合隶属 度等值线图总是能显示出类与类之间有明显的界限, 这克服了极点等密度图难以区分不同分组的缺点. 3 工程应用 以三山岛金矿 - 105 m 中段巷道内裸露的岩壁 上测得的结构面为例,实测数据含有 350 个结构面. 图 2 给出了 350 个结构面的极点等密度图、倾向玫瑰 图和 倾 角 玫 瑰 图( 以 Mathematica 为 平 台 自 编 程 序 SPCD 实现,画法参照文献[1],本文中采用上半球投 影) . 由图可以看到这组数据优势组不明显,从传统 的方法中难以区分优势组,难以获得准确的优势组 中心. 图 2 - 105 m 结构面极点等密度图(a)、倾向玫瑰图(b)和走向玫瑰图(c) Fig. 2 Pole isodensity map (a),dip direction rose diagram (b) and trend rose diagram (c) of discontinuities in the - 105 m level 实测结构面分布较为分散,结合极点等密度图的 观察确定分组数为四组,破碎岩体常采用 3 ~ 4 组分 组,因为过多的分组并不利于工程实际的应用. 利用 上文的方法,经过模糊 C 均值聚类分析,计算聚类中 心见表 1,绘制每个类的隶属度等值线图见图 3,绘制 综合隶属度等值线图见图 4. 表 1 FCM 聚类中心计算 Table 1 Cluster centers of FCM clustering 聚类 T = 0 T = 0. 5 T = 0. 75 T = 0. 9 传统方法(极点等密度图) 倾向/(°) 倾角/(°) 倾向/(°) 倾角/(°) 倾向/(°) 倾角/(°) 倾向/(°) 倾角/(°) 倾向/(°) 倾角/(°) C1 287. 1 64. 8 295 66 293. 2 66. 8 289. 8 67. 2 275 ~ 320 60 ~ 70 C2 69. 3 65. 3 61. 2 66. 9 64. 4 66. 9 65. 9 63. 8 80 ~ 105 50 ~ 75 C3 140. 1 60. 2 140. 3 61. 2 140. 6 61. 6 141. 1 62. 3 135 ~ 170 55 ~ 65 C4 203. 3 59. 9 203. 9 61. 8 206. 6 62. 0 205. 1 61. 1 — — 从表 1 看到,利用模糊聚类方法可以定量得到的 聚类中心,采用不同的阈值计算的聚类中心相差不超 过 5°,远远小于利用极点等密度图产生的主观误差, 稳定性较好,因此选取不同的 T 值都是合适的. 从图 3 可以清楚地看出每一个类的隶属度的空间变化,而且 每一个类的隶属度向聚类中心凝聚,单峰性质明显,证 明聚类取得了很好的效果. 图 4 是图 3 的综合显示, 通过定义显示的范围可以很明确地划分出类与类之间 的界限(白色部分),很直观地分辨出每个结构面所属 的类,同时还可以分辨出那些分类不明确的结构面 (图中白色区域内的结构面). 这些结构面很有可能是 一些次要的随机因素形成的,这是传统方法和硬聚类 方法不能实现的. 另外,还可以从图 4 中直观地读出 每个类的聚类中心的范围. 例如,若以隶属度为 0. 95 为聚类中心的标准,C1 类的中心范围为倾向 275° ~ 298°,倾角 52° ~ 75°;C2 类中心范围为倾向 55° ~ 78°, 倾角 55° ~ 75°;C3 类的中心范围为倾向 133° ~ 147°, 倾角 53° ~ 67°;C4 类的中心范围为倾向 195° ~ 215°, 倾角 51° ~ 65°. 聚类中心以范围的形式表示比确切的 单一数值更具实际意义. 对比传统方法(图 2(a))和本文方法(图 4),可以 发现这两种方法所得的结果有所差别:表 1 优势结构 面显示,传统方法判别优势结构面范围笼统,并且没有 判别出倾角 210°方向优势组;除此之外,另外三个优 势组两种方法吻合较好. 关于这点可以解释如下:① 本文例子中的数据较为分散,优势组之间界限不明,导 致极点等密度图等值线的数值保持在较低的水平 (1% ~ 3% ),这降低了优势组的判别的可靠性,增强 ·696·
修国林等:基于模糊C均值聚类和图形技术的结构面产状分析方法 ·697 N 30 30 40 3300300 10°20 30 40° 310 50r 31 50 300 60e 300 60 290 。 70 290 280 ” 80 280° 80 W270 W270 260 100 2609 100 250 .110 250° 110 240 120 240 120 230° 130° 230 130 220 220 21 210° 200 200 N 33040350 10 20 30° 32 30 40° 40 310 50 310 … …… 50 300 60 300 。 290 70 290 70 280 0 280 W270 90°E W270 260° 100 260 100 250 110e 250 110 C3 240 120 240 120 230 130° 230 130 220 220° 140 10° 图3 -105m中段各个类的隶属度等值线图.(a)C1:(b)C2:(c)C3:(d)C4 Fig.3 Membership contour map for each cluster of the -105m level:(a)Cl:(b)C2:(c)C3:(d)C4 以发现,极点等密度图中极点较为密集的优势组在综 10r 20 合隶属度等值图中对应的类看上去范围较小,这是因 30 80 40r 310 为极点越是密集的区域聚类效果越好,隶属度分布越 50 300 60 60 集中.这个特征使得综合隶属度等值图能够反应每个 30 类的密集程度,图中颜色范围越小的类对应的极点越 80 密集 W270 10 90E 260 100 图5和图6分别给出三山岛金矿-135m中段和 250 110 -165m中段的应用,进一步证明了本文方法的实 240 120 用性 230Y 130r 220 210 90180r170160150 4结论 200 (1)隶属度等值图具有传统的极点等密度图直观 图4-105m中段综合隶属度等值线图 优点,使用者可以很容易读出聚类分组数、每个类的聚 Fig.4 Synthesized membership contour map for the -105 m level 类中心以及聚类中心的范围的信息:同时它也具有聚 类分析技术客观的优点,在整个过程中没有主观判断 了主观判别误差:②本文中的方法以求解优化问题 的成分的影响. (2)为基础,求解过程完全依赖客观数据,但是确定初 (2)充分利用了模糊C均值聚类得到的隶属度矩 始聚类数C时具有一定的主观性,这个问题值得进一 阵中的信息,可以从中获得比极点等密度图和聚类分 步研究 析更多的信息,例如分辨由于次要的随机因素形成的 另外,对比极点等密度图和综合隶属度等值图可 结构面,并且能够通过图中颜色区域的大小反应极点
修国林等: 基于模糊 C 均值聚类和图形技术的结构面产状分析方法 图 3 - 105 m 中段各个类的隶属度等值线图. (a) C1;(b) C2;(c) C3;(d) C4 Fig. 3 Membership contour map for each cluster of the - 105 m level: (a) C1; (b) C2; (c) C3; (d) C4 图 4 - 105 m 中段综合隶属度等值线图 Fig. 4 Synthesized membership contour map for the - 105 m level 了主观判别误差;②本文中的方法以求解优化问题 (2)为基础,求解过程完全依赖客观数据,但是确定初 始聚类数 C 时具有一定的主观性,这个问题值得进一 步研究. 另外,对比极点等密度图和综合隶属度等值图可 以发现,极点等密度图中极点较为密集的优势组在综 合隶属度等值图中对应的类看上去范围较小,这是因 为极点越是密集的区域聚类效果越好,隶属度分布越 集中. 这个特征使得综合隶属度等值图能够反应每个 类的密集程度,图中颜色范围越小的类对应的极点越 密集. 图 5 和图 6 分别给出三山岛金矿 - 135 m 中段和 - 165 m 中 段 的 应 用,进 一 步 证 明 了 本 文 方 法 的 实 用性. 4 结论 (1) 隶属度等值图具有传统的极点等密度图直观 优点,使用者可以很容易读出聚类分组数、每个类的聚 类中心以及聚类中心的范围的信息;同时它也具有聚 类分析技术客观的优点,在整个过程中没有主观判断 的成分的影响. (2) 充分利用了模糊 C 均值聚类得到的隶属度矩 阵中的信息,可以从中获得比极点等密度图和聚类分 析更多的信息,例如分辨由于次要的随机因素形成的 结构面,并且能够通过图中颜色区域的大小反应极点 ·697·
698 工程科学学报,第37卷,第6期 N 四 .403500rwg0 (b) .90° 209 310 320° 80炉. 40° 50 310° 70, 30 50 60 300 6 60 290 70° 290 40 709 280 80° 280 80° W270 90°E W270 8 90°E 260 100 2609 100° 250 110 250° 110° 240 120° 240° 120 230 130 230° 130° 220 40° 220 1409 10200190°180°170160-150 71s071807Dr1601 210° 图5-135m中段结构面极点等密度图(a)和综合隶属度等值图(b) Fig.5 Pole isodensity map (a)and synthesized membership contour map (b)of discontinuities in the -135 m level N 4035010208 (b) 330 340350031020° 1.90° 320 330 30° 320° 80 。.40° 310° 50 310 .79 50 300 60° 300 .60 60° 290 70 290° 40 70° 280F -80 280 2 -80° 10 W270 90°E W270 260 100 260° 64 100 250 110 250 110° 240° 120 240 41 120° 230° 130° 230°.· 130° 220° 40° 22 10200190°180e170-l60.50 wi01wn01w200 210 图6-165m中段结构面极点等密度图(a)和综合隶属度等值图(b) Fig.6 Pole isodensity map (a)and synthesized membership contour map (b)of discontinuities in the -165 m level 的密集程度 Rock Mech Eng,2007,26(9)1809 (3)三山岛金矿实例证明隶属度等值线图具有很 (卢波,丁秀丽,邬爱清.岩体随机不连续面产状数据划分方 好的实用价值,模糊C均值聚类技术适合优势组不够 法研究.岩石力学与工程学报,2007,26(9):1809) [4] Song J L,Huang R Q,Pei X J.Particle swarm optimization algo- 明显的结构面数据 rithm based fuzzy C-means cluster analysis for discontinuities occurrence in rock mass.J Eng Geol,2012,20(4):591 参考文献 (宋金龙,黄润秋,裴向军.基于粒子群算法的岩体结构面产 状模糊C均值聚类分析.工程地质学报,2012,20(4):591) [Brady B H G,Brown E T.Rock Mechanics for Underground Min- 5]Deng J H,Chen B L,Wu X N,et al.self-organizing clustering ing.Berlin:Springer,2004 analysis for discontinuities occurrence.J Yangtze River Sci Res 2]Cai MF,Wang P,Zhao K,et al.Fuzzy C-means cluster analysis Inst,2011,28(3):50 based on genetic algorithm for automatic identification of joint set. (邓继辉,陈柏林,吴小宁,等.岩体结构面产状的自组织聚 Chin J Rock Mech Eng,2005,24(3):371 类分析.长江科学院院报,2011,28(3):50) (蔡美峰,王鹏,赵奎,等.基于遗传算法的岩体结构面的模 Xu B G,Wang C L,Tang S H.Distribution characteristic of rock 糊C均值聚类方法.岩石力学与工程学报,2005,24(3): structural plates at large mine goal in Guangxi province.Eng 371) Geol,2008,16(5):639 B]Lu B,Ding X L,Wu A Q.Study on method of orientation data (徐必根,王春来,唐绍辉.大体积采空区岩体结构面聚类分 partitioning of randomly distributed discontinuities of rocks.Chin 布特征研究.工程地质学报,2008,16(5):639)
工程科学学报,第 37 卷,第 6 期 图 5 - 135 m 中段结构面极点等密度图(a)和综合隶属度等值图(b) Fig. 5 Pole isodensity map (a) and synthesized membership contour map (b) of discontinuities in the - 135 m level 图 6 - 165 m 中段结构面极点等密度图(a)和综合隶属度等值图(b) Fig. 6 Pole isodensity map (a) and synthesized membership contour map (b) of discontinuities in the - 165 m level 的密集程度. (3) 三山岛金矿实例证明隶属度等值线图具有很 好的实用价值,模糊 C 均值聚类技术适合优势组不够 明显的结构面数据. 参 考 文 献 [1] Brady B H G,Brown E T. Rock Mechanics for Underground Mining. Berlin: Springer,2004 [2] Cai M F,Wang P,Zhao K,et al. Fuzzy C-means cluster analysis based on genetic algorithm for automatic identification of joint set. Chin J Rock Mech Eng,2005,24(3): 371 (蔡美峰,王鹏,赵奎,等. 基于遗传算法的岩体结构面的模 糊 C 均值聚类方法. 岩石力学与工程学报,2005,24 (3 ): 371) [3] Lu B,Ding X L,Wu A Q. Study on method of orientation data partitioning of randomly distributed discontinuities of rocks. Chin J Rock Mech Eng,2007,26(9): 1809 (卢波,丁秀丽,邬爱清. 岩体随机不连续面产状数据划分方 法研究. 岩石力学与工程学报,2007,26(9): 1809) [4] Song J L,Huang R Q,Pei X J. Particle swarm optimization algorithm based fuzzy C-means cluster analysis for discontinuities occurrence in rock mass. J Eng Geol,2012,20(4): 591 (宋金龙,黄润秋,裴向军. 基于粒子群算法的岩体结构面产 状模糊 C 均值聚类分析. 工程地质学报,2012,20(4): 591) [5] Deng J H,Chen B L,Wu X N,et al. self-organizing clustering analysis for discontinuities occurrence. J Yangtze River Sci Res Inst,2011,28(3): 50 (邓继辉,陈柏林,吴小宁,等. 岩体结构面产状的自组织聚 类分析. 长江科学院院报,2011,28(3): 50) [6] Xu B G,Wang C L,Tang S H. Distribution characteristic of rock structural plates at large mine goal in Guangxi province. J Eng Geol,2008,16(5): 639 (徐必根,王春来,唐绍辉. 大体积采空区岩体结构面聚类分 布特征研究. 工程地质学报,2008,16(5): 639) ·698·
修国林等:基于模糊C均值聚类和图形技术的结构面产状分析方法 ·699· Li J M.The improved K-means clustering analysis for discontinui- ron Eng,2010,17(4):114 ties occurrence of rock mass.J Yangtze River Sci Res Inst,2012, (膝继东,徐光黎,申艳军。基于蚁群算法的结构面产状模 29(9):49 糊C均值聚类分析.安全与环境工程,2010,17(4):114) (李继明.岩体结构面产状改进的K均值聚类分析.长江科 [11]Li X B,Wang Z W,Peng K,et al.Ant colony ATTA clustering 学院院报,2012,29(9):49) algorithm of rock mass structural plane in groups.J Cent South [8]Zhou Y X,Zhou Z F,Sun Q G.Synthetical fuzzy clustering anal- mim,2014,21(2):709 ysis for joints occurrence of rock mass.Chin I Rock Mech Eng, [12]Ruspini E H.Numerical methods for fuzzy clustering.Inf Sci, 2005,24(13):2283 1970,2(3):319 (周玉新,周志芳,孙其国.岩体结构面产状的综合模糊聚类 [13]Dunn J C.A fuzzy relative of the ISODATA process and its use 分析.岩石力学与工程学报,2005,24(13):2283) in detecting compact well-separated cluster.J Cybern,1973, Wang P,Zhao X L.Wan L.H,et al.A mixed clustering method 3(3):32 based on GA and FCM for discontinuities of rock mass.J Unig Sci [14]Berdek J C.Pattern Recognition with Fuzzy Objective Function Technol Beijing,2004,26(3):227 Algorithms.Norwell:Kluwer Academic Publishers,1981 (王鹏,赵学亮,万林海,等.基于GA和FCM的岩体结构面 [15]Bezdek J C,Ehrlich R,Full W.FCM:the fuzzy c-means cluste- 的混合聚类方法.北京科技大学学报,2004,26(3):227) ring algorithm.Comput Geosci,1984,10(2):191 [10]Teng J D.Xu G L.Shen Y J.Fuzzy C-means cluster analysis [16]Pal N R,Bezdek J C.On cluster validity for the fuzzy c-means based on ant colony algorithm for orientations of joint.Saf Enri- model.IEEE Trans Fuzzy Syst,1995,3(3):370
修国林等: 基于模糊 C 均值聚类和图形技术的结构面产状分析方法 [7] Li J M. The improved K-means clustering analysis for discontinuities occurrence of rock mass. J Yangtze River Sci Res Inst,2012, 29(9): 49 (李继明. 岩体结构面产状改进的 K 均值聚类分析. 长江科 学院院报,2012,29(9): 49) [8] Zhou Y X,Zhou Z F,Sun Q G. Synthetical fuzzy clustering analysis for joints occurrence of rock mass. Chin J Rock Mech Eng, 2005,24(13): 2283 (周玉新,周志芳,孙其国. 岩体结构面产状的综合模糊聚类 分析. 岩石力学与工程学报,2005,24(13): 2283) [9] Wang P,Zhao X L,Wan L H,et al. A mixed clustering method based on GA and FCM for discontinuities of rock mass. J Univ Sci Technol Beijing,2004,26(3): 227 (王鹏,赵学亮,万林海,等. 基于 GA 和 FCM 的岩体结构面 的混合聚类方法. 北京科技大学学报,2004,26(3): 227) [10] Teng J D,Xu G L,Shen Y J. Fuzzy C-means cluster analysis based on ant colony algorithm for orientations of joint. Saf Environ Eng,2010,17(4): 114 (滕继东,徐光黎,申艳军. 基于蚁群算法的结构面产状模 糊 C 均值聚类分析. 安全与环境工程,2010,17(4): 114) [11] Li X B,Wang Z W,Peng K,et al. Ant colony ATTA clustering algorithm of rock mass structural plane in groups. J Cent South Univ,2014,21(2): 709 [12] Ruspini E H. Numerical methods for fuzzy clustering. Inf Sci, 1970,2(3): 319 [13] Dunn J C. A fuzzy relative of the ISODATA process and its use in detecting compact well-separated cluster. J Cybern,1973, 3(3): 32 [14] Bezdek J C. Pattern Recognition with Fuzzy Objective Function Algorithms. Norwell: Kluwer Academic Publishers,1981 [15] Bezdek J C,Ehrlich R,Full W. FCM: the fuzzy c-means clustering algorithm. Comput Geosci,1984,10(2): 191 [16] Pal N R,Bezdek J C. On cluster validity for the fuzzy c-means model. IEEE Trans Fuzzy Syst,1995,3(3): 370 ·699·