D0I:10.13374/j.issnl(00103x.2011.01.019 第33卷第1期 北京科技大学学报 Vo]33 No 1 2011年1月 JoumalofUniversity of Science and Technopgy Beijng Jan 2011 基于RSGP糢型的边坡安全系数预测 翟淑花2烟 吴爱祥12》高谦2) 张梅花”董璐” 1)北京科技大学土木与环境工程学院。北京1000832)北京科技大学金属矿山高效开采与安全教有部重点实验室北京100083 ☒通信作者,Emai!a ishuhuahb@163cm 摘要鉴于边坡系统影响因素之间的高度非线性和不确定性,融合RSGP模型的优势.提出了依据边坡稳定性影响因素类 比计算边坡安全系数的方法.该方法通过学习样本的数据特征分析、计算属性的重要性及约简规则,降低了遗传规划预测模 型的结构规模,人工神经网络(AN)模型与RSGP模型计算结果比较表明:该方法具有计算速度快、容错能力强及精度高等 特点. 关键词边坡稳定;安全系数:粗糙集理论:遗传规划 分类号TD8546 Pred iction of slope safety factor based on the RSGPm odel ZHAI Shuhua WU Aixiang 2).GAO Qian 2 ZHANGMeihua.DONG LP 1)School ofCivil and Env iormental Engneerng Universit of Science and Technobgy Beijng Beijng 100083 China 2)Key Labortory of the Ministry of Educat ion of Chna forH gh-E ffic ientMining and Safety ofMelMnes University of Science and Technokgy Bei jing Beijing 100083 Chna Comespand ing author Email zhaishuhuahbu@163 com ABSTRACT Considering the h gh nonlnearit and uncenanty of in fuence factors in a sppe system andmang full use of the ad van nages of the rough set theory and genetic programming(RSGP modeh a novelmethod based on he n fluencing facors of slope sta bility was brought up p caculate he saety factorof a sppe This method can reduce the stucure scale of a genetic prgramm ing pre dictpnmodelby analzing he data characteristics of leaming samples calcu lating he significance of attrbu tes and reducng ru les The results of an ANNmodel and the RSGP model show hat the proposedmehod has suchmerits as ast computng speed h gh fault pler ance capacity and hgh precision KEY WORDS sppe stab ility safety actor rough set heory enetic progrmm ng 边坡稳定性评价一直是工程地质学者长期研究 的选择尚无一种统一而完整的理论指导,一般只能 的焦点,也是人类工程、经济活动的需要,因而出现 由经验选定.鉴于此本文首先将采用粗糙集理论 了大量各具特色的研究成果,并在一定历史时期为 对学习样本进行消冗去噪,获得影响边坡稳定的样 人类认识自然,改造环境做出了特有的贡献.边坡 本精华,然后采用遗传规划获得边坡影响因素与安 是一个复杂的系统,在众多影响因素的耦合作用下, 全系数之间的非线性函数关系,对安全系数进行预 其变形特征具有很强的非线性和不确定性.因此, 测,并将预测结果与人工神经网络预测结果进行对 随着非线性科学的高度发展,很多学者将其应用到 比分析 边坡稳定性的研究和分析中去.其中应用最广 1方法 的是人工神经网络,但由于测量手段、仪器和人的主 观性等原因,所获的数据不可避免地具有干扰性,即 1.1粗糙集理论 用于训练神经网络的学习样本存在很大的噪声,影 粗糙集(ough set RS)理论是波兰学者Paw, 响了网络的推广和泛化能力.同时,神经网络结构 于1982年提出的一种知识自动发现理论,是描述不 收稿日期:2010-03-26
第 33卷 第 1期 2011年 1月 北 京 科 技 大 学 学 报 JournalofUniversityofScienceandTechnologyBeijing Vol.33 No.1 Jan.2011 基于 RS--GP模型的边坡安全系数预测 翟淑花 1, 2) 吴爱祥 1, 2) 高 谦 1, 2) 张梅花 1) 董 璐 1) 1)北京科技大学土木与环境工程学院, 北京 100083 2)北京科技大学金属矿山高效开采与安全教育部重点实验室, 北京 100083 通信作者, E-mail:zhaishuhuahbu@163.com 摘 要 鉴于边坡系统影响因素之间的高度非线性和不确定性, 融合 RS--GP模型的优势, 提出了依据边坡稳定性影响因素类 比计算边坡安全系数的方法.该方法通过学习样本的数据特征分析、计算属性的重要性及约简规则, 降低了遗传规划预测模 型的结构规模.人工神经网络(ANN)模型与 RS-GP模型计算结果比较表明:该方法具有计算速度快、容错能力强及精度高等 特点. 关键词 边坡稳定;安全系数;粗糙集理论;遗传规划 分类号 TD854.6 PredictionofslopesafetyfactorbasedontheRS-GPmodel ZHAIShu-hua1, 2) , WUAi-xiang1, 2) , GAOQian1, 2) , ZHANGMei-hua1) , DONGLu1) 1)SchoolofCivilandEnvironmentalEngineering, UniversityofScienceandTechnologyBeijing, Beijing100083, China 2)KeyLaboratoryoftheMinistryofEducationofChinaforHigh-EfficientMiningandSafetyofMetalMines, UniversityofScienceandTechnologyBeijing, Beijing100083, China Correspondingauthor, E-mail:zhaishuhuahbu@163.com ABSTRACT Consideringthehighnonlinearityanduncertaintyofinfluencefactorsinaslopesystemandmakingfulluseoftheadvantagesoftheroughsettheoryandgeneticprogramming(RS-GPmodel), anovelmethodbasedontheinfluencingfactorsofslopestabilitywasbroughtuptocalculatethesafetyfactorofaslope.Thismethodcanreducethestructurescaleofageneticprogrammingpredictionmodelbyanalyzingthedatacharacteristicsoflearningsamples, calculatingthesignificanceofattributesandreducingrules.The resultsofanANNmodelandtheRS-GPmodelshowthattheproposedmethodhassuchmeritsasfastcomputingspeed, highfault-tolerancecapacityandhighprecision. KEYWORDS slopestability;safetyfactor;roughsettheory;geneticprogramming 收稿日期:2010-03-26 边坡稳定性评价一直是工程地质学者长期研究 的焦点,也是人类工程、经济活动的需要 ,因而出现 了大量各具特色的研究成果, 并在一定历史时期为 人类认识自然 、改造环境做出了特有的贡献 .边坡 是一个复杂的系统 ,在众多影响因素的耦合作用下, 其变形特征具有很强的非线性和不确定性.因此, 随着非线性科学的高度发展, 很多学者将其应用到 边坡稳定性的研究和分析中去 [ 1--4] .其中应用最广 的是人工神经网络 ,但由于测量手段、仪器和人的主 观性等原因,所获的数据不可避免地具有干扰性 ,即 用于训练神经网络的学习样本存在很大的噪声, 影 响了网络的推广和泛化能力 .同时, 神经网络结构 的选择尚无一种统一而完整的理论指导, 一般只能 由经验选定 .鉴于此, 本文首先将采用粗糙集理论 对学习样本进行消冗去噪 , 获得影响边坡稳定的样 本精华 ,然后采用遗传规划获得边坡影响因素与安 全系数之间的非线性函数关系 ,对安全系数进行预 测 ,并将预测结果与人工神经网络预测结果进行对 比分析 . 1 方法 1.1 粗糙集理论 粗糙集 (roughset, RS)理论是波兰学者 Pawlak 于 1982年提出的一种知识自动发现理论, 是描述不 DOI :10.13374/j .issn1001 -053x.2011.01.019
第1期 翟淑花等:基于RSGP模型的边坡安全系数预测 7 完整性和不确定性的数学工具,能有效地分析和处 表示集合中包含元素的个数,P0(Y)是指对于决 理不精确、不一致和不完整等各种不完备信息,并从 策属性Y可以判断肯定属于X的元素的个数.显 中发现隐含的知识,揭示潜在的规律,生成并简化决 然,P(D的大小从总体上反映了知识D对知识C 策规则.粗糙集理论的最主要贡献在于考虑数据客 的依赖程度.同时,相对于决策属性集合D各条件 观不完整性和不确定性的同时,避免了模糊理论中 属性在整个条件属性集合中的重要程度会不相同. 主观因素影响过大的缺点.粗糙集理论在约简规 若条件属性集合中有无条件属性∈C对决策属性 则、处理数据时,不需要了解数据的先验信息,如概 集合的支持度改变不大,则可认为条件属性G的重 率分布和隶属度.对于同一个数据集,在粗糙集理 要程度不高,属于冗余属性,省略后不会影响到对象 论工具下进行处理,最终得到所需的信息更简单、更 特征的描述.条件属性S关于决策属性D的重要 准确以及更易于被决策者接受和理解5-. 程度定义见下式: 为了定义知识的近似程度,粗糙集理论引入下 s建9=Pt(D)-Pt9(D) (5) 近似集和上近似集的概念,对于给定的知识库K一 (yR和每个子集二U以及一个等价关系R∈ 由此可知,s-9越大属性9在整个条件属性集 dK,其下近似集和上近似集分别表示为 合中的重要性越高。利用这一特性,就可进行知识 RX={EU1二 约简,从众多的特征信息中提取有用的属性,简化处 (1) 理过程. RX={∈UI[1n≠) (2) 1.2遗传规划的基本原理 图1为粗糙集概念示意图,其中正域P0:是指 根据知识判断肯定属于的元素组成的集合,负域 遗传规划(genetic programm ing GPy-川是斯 是指根据知识判断肯定不属于X的元素的集 坦福大学的K0于1992年提出的一种自动化编程 合,边界域bh是指根据知识既不能判断肯定属于 技术,是采用层次可变的计算机程序组合来表达问 X也不能判断肯定不属于X的集合.它们与上下近 题.根据程序表达含义和组合位置的不同分为函数 集F和终止符集T其中函数集F包括运算符号、数 似集的关系如下式所示: POR=RX 学函数和条件表达式等,终止符集T包括变量(如 描述系统的输入、状态变量和常量等.表达形式为 neg=U-RX (3) 分析树(见图2),其中函数集F中的元素为根节点, bnk=RX-RX 终止符集T中的元素为叶结点.总的来说,遗传规 划与神经网络相比,突出优点为:①模型群体的学习 和进化,避免了模型“过拟合”可能:②关键参数少 边界域 且受用户设定值影响小,由初始设定参数即可获得 较好的模型. 负域 集合X 角 + 图1粗糙集概念图 Fg 1 Concept of the rough set 粗糙集理论认为数据的重要程度是不同的,有 ⊙ ⑥ 些数据是不重要的、冗余的.可以在不影响分析和 图2GP分析树 决策结果的前提下,将不重要的、冗余的信息约简, Fg 2 Parse tree ofGP 从而减少信息数量,提高计算速度.根据粗糙集理 论,论域中的对象根据条件属性的不同被划分到具 2基于RSGP的边坡安全系数预测模型 有不同决策属性的决策类.若U/C={芩 ,UD={¥,多名,则决策属性D关于条 2.1样本的选取 件属性C(或称C对D)的支持度定义为 考虑到边坡系统的非线性和不确定性,借鉴相 (D-d会Io(l Y∈U/D(4) 关文献[12-13]初步选取边坡工程稳定性的影响因 素为边坡高度、边坡角度、重度、内聚力、内摩擦角以 式中,「表示集合的基数或势,对于有限集合,则 及孔隙压力系数,搜集到的样本见表1如果单纯采
第 1期 翟淑花等:基于 RS--GP模型的边坡安全系数预测 完整性和不确定性的数学工具, 能有效地分析和处 理不精确 、不一致和不完整等各种不完备信息,并从 中发现隐含的知识 ,揭示潜在的规律,生成并简化决 策规则.粗糙集理论的最主要贡献在于考虑数据客 观不完整性和不确定性的同时, 避免了模糊理论中 主观因素影响过大的缺点.粗糙集理论在约简规 则、处理数据时 ,不需要了解数据的先验信息, 如概 率分布和隶属度 .对于同一个数据集, 在粗糙集理 论工具下进行处理 ,最终得到所需的信息更简单 、更 准确以及更易于被决策者接受和理解 [ 5--9] . 为了定义知识的近似程度 ,粗糙集理论引入下 近似集和上近似集的概念 ,对于给定的知识库 K= (U, R)和每个子集 X U以及一个等价关系 R∈ ind(K),其下近似集和上近似集分别表示为 RX={x∈ U [ x] R X} (1) RX={x∈ U [ x] R∩ X≠ } (2) 图 1为粗糙集概念示意图 ,其中正域 posR 是指 根据知识判断肯定属于 X的元素组成的集合 ,负域 negR是指根据知识判断肯定不属于 X的元素的集 合, 边界域 bnR是指根据知识既不能判断肯定属于 X也不能判断肯定不属于 X的集合.它们与上下近 似集的关系如下式所示 : posR =RX negR =U-RX bnR =RX-RX (3) 图 1 粗糙集概念图 Fig.1 Conceptoftheroughset 粗糙集理论认为数据的重要程度是不同的, 有 些数据是不重要的 、冗余的 .可以在不影响分析和 决策结果的前提下, 将不重要的 、冗余的信息约简, 从而减少信息数量 ,提高计算速度 .根据粗糙集理 论, 论域中的对象根据条件属性的不同被划分到具 有不同决策属性的决策类.若 U/C={x1 , x2 , …, xn}, U/D={Y1 , Y2 , … , Ym},则决策属性 D关于条 件属性 C(或称 C对 D)的支持度定义为 sptC(D)= 1 U ∑ m i=1 posC(Yi) , Yi∈ U/D (4) 式中 , # 表示集合 #的基数或势 ,对于有限集合, 则 表示集合中包含元素的个数 , posC(Yi)是指对于决 策属性 Yi,可以判断肯定属于 X的元素的个数.显 然 , sptC(D)的大小从总体上反映了知识 D对知识 C 的依赖程度 .同时, 相对于决策属性集合 D, 各条件 属性在整个条件属性集合中的重要程度会不相同 . 若条件属性集合中有无条件属性 ci∈ C对决策属性 集合的支持度改变不大, 则可认为条件属性 ci的重 要程度不高 ,属于冗余属性 ,省略后不会影响到对象 特征的描述 .条件属性 ci关于决策属性 D的重要 程度定义见下式 : sig D C-{ci} =sptc(D)-sptC-{ci}(D) (5) 由此可知 , sig D C-{ci}越大, 属性 ci在整个条件属性集 合中的重要性越高.利用这一特性 , 就可进行知识 约简,从众多的特征信息中提取有用的属性,简化处 理过程 . 1.2 遗传规划的基本原理 遗传规划 (geneticprogramming, GP) [ 10--11] 是斯 坦福大学的 Koza于 1992年提出的一种自动化编程 技术,是采用层次可变的计算机程序组合来表达问 题 .根据程序表达含义和组合位置的不同分为函数 集 F和终止符集 T,其中函数集 F包括运算符号、数 学函数和条件表达式等, 终止符集 T包括变量 (如 描述系统的输入 、状态变量 )和常量等 .表达形式为 分析树 (见图 2),其中函数集 F中的元素为根节点 , 终止符集 T中的元素为叶结点 .总的来说 ,遗传规 划与神经网络相比,突出优点为 :①模型群体的学习 和进化 ,避免了模型 “过拟合 ”可能;②关键参数少 且受用户设定值影响小 , 由初始设定参数即可获得 较好的模型 . 图 2 GP分析树 Fig.2 ParsetreeofGP 2 基于 RS--GP的边坡安全系数预测模型 2.1 样本的选取 考虑到边坡系统的非线性和不确定性, 借鉴相 关文献 [ 12--13] 初步选取边坡工程稳定性的影响因 素为边坡高度、边坡角度、重度 、内聚力、内摩擦角以 及孔隙压力系数 ,搜集到的样本见表 1.如果单纯采 · 7·
。8° 北京科技大学学报 第33卷 表1边坡安全系数样本集 Table 1 Samples of sppe safety facor 序号 坡高m 坡角/() 容重/(kNm一)黏聚力MPa 内摩擦角/(°) 孔隙水压力系数 安全系数 1 10.00 2657 19.61 31.70 13.00 090 1.61 2 620 1672 1880 Q.00 20.00 030 0.75 3 1220 17.10 18.80 150 2000 032 0.98 4 21.00 2200 2000 0.00 2000 050 0.90 5 1000 45.00 2240 10.00 35.00 040 0.90 6 7.62 2657 17.61 7.66 2600 020 1.13 7 3280 1816 17.00 1200 1630 1.00 0.94 8 490 1843 18.80 1.20 20.00 027 1.10 9 17.00 33.69 1880 1.00 20.00 0.43 0.97 而 9.10 2660 1831 5.16 15.12 010 0.99 856 4450 1850 20.00 10.00 000 1.15 白 4400 19.98 2280 1680 37.50 0.40 1.50 13 7.00 2657 18.80 1.00 2000 010 0.81 复 10.00 33.69 17.66 7.85 25.00 025 1.07 15 10.04 15.24 1880 0.00 20.00 033 0.97 16 5.10 25.25 1805 5.75 1800 0.64 0.62 17 21.00 20.00 19.72 30.00 30.00 0.50 1.54 50.00 45.00 22.00 21.00 3600 0.25 1.02 19 4420 20.00 2200 1680 37.50 050 1.25 20 13.70 2657 1871 0.00 1400 000 1.28 21 4410 19.98 2280 1650 37.50 030 0.68 22 15.00 1299 2000 21.00 17.00 1.00 1.05 23 2500 2200 18.80 30.00 2000 025 1.36 24 10.00 39.81 2036 0.98 3250 070 1.01 25 430 27.00 19.60 9.60 25.00 032 0.97 26 2115 2200 20.00 20.00 2000 0.50 1.12 27 11.50 27.60 17.71 9.09 20.35 000 1.25 28 1067 2200 2041 2491 13.00 035 1.40 29 1219 2200 19.63 1197 20.00 041 1.35 30 280 2800 21.82 862 3200 049 1.03 45.72 1600 2041 38.52 11.00 020 1.28 32 10.67 25.00 1884 15.32 30.00 0.38 1.63 3 7.62 20.00 18.84 0.00 20.00 045 1.05 61.00 2000 21.43 0.00 20.00 050 1.03 11000 41.00 27.30 1400 31.00 0.25 1.25 36 3050 20.00 1884 14.36 25.00 045 1.11 37 7681 31.00 21.51 694 30.00 038 1.01 38 8盆00 30.00 14.00 11.97 2600 045 0.66 39 2000 45.00 18.00 24.00 3015 012 1.12 40 10m00 20.00 23.00 0.00 20.00 030 1.20 41 15.00 45.00 2240 100.00 45.00 025 1.80 42 1000 45.00 2240 10.00 35.00 040 0.90 43 5000 45.00 20.00 21.00 3600 050 0.83 44 50.00 45.00 2000 0.00 3600 025 0.79 45 50.00 45.00 2000 0.00 3600 050 0.67 46 27.43 2640 17.29 4.54 1200 000 1.52 47 800 45.00 1845 1806 1010 014 0.97 48 9.50 25.50 18.61 1042 1014 031 1.03 49 30.00 2056 19.61 1471 20.00 000 1.75 注:带*样本为测试样本
北 京 科 技 大 学 学 报 第 33卷 表 1 边坡安全系数样本集 Table1 Samplesofslopesafetyfactor 序号 坡高 /m 坡角 /(°) 容重 /(kN·m-3 ) 黏聚力 /MPa 内摩擦角 /(°) 孔隙水压力系数 安全系数 1 10.00 26.57 19.61 31.70 13.00 0.90 1.61 2 6.20 16.72 18.80 0.00 20.00 0.30 0.75 3 12.20 17.10 18.80 1.50 20.00 0.32 0.98 4 20.00 22.00 20.00 0.00 20.00 0.50 0.90 5 10.00 45.00 22.40 10.00 35.00 0.40 0.90 6 7.62 26.57 17.61 7.66 26.00 0.20 1.13 7 32.80 18.16 17.00 12.00 16.30 1.00 0.94 8 4.90 18.43 18.80 1.20 20.00 0.27 1.10 9 17.00 33.69 18.80 1.00 20.00 0.43 0.97 10 9.10 26.60 18.31 5.16 15.12 0.10 0.99 11 8.56 44.50 18.50 20.00 10.00 0.00 1.15 12 44.00 19.98 22.80 16.80 37.50 0.40 1.50 13 7.00 26.57 18.80 1.00 20.00 0.10 0.81 14 10.00 33.69 17.66 7.85 25.00 0.25 1.07 15 10.04 15.24 18.80 0.00 20.00 0.33 0.97 16 5.10 25.25 18.05 5.75 18.00 0.64 0.62 17 20.00 20.00 19.72 30.00 30.00 0.50 1.54 18 50.00 45.00 22.00 20.00 36.00 0.25 1.02 19 44.20 20.00 22.00 16.80 37.50 0.50 1.25 20 13.70 26.57 18.71 0.00 14.00 0.00 1.28 21 44.10 19.98 22.80 16.50 37.50 0.30 0.68 22 15.00 12.99 20.00 21.00 17.00 1.00 1.05 23 25.00 22.00 18.80 30.00 20.00 0.25 1.36 24 10.00 39.81 20.36 0.98 32.50 0.70 1.01 25 14.30 27.00 19.60 9.60 25.00 0.32 0.97 26 20.15 22.00 20.00 20.00 20.00 0.50 1.12 27 11.50 27.60 17.71 9.09 20.35 0.00 1.25 28 10.67 22.00 20.41 24.91 13.00 0.35 1.40 29 12.19 22.00 19.63 11.97 20.00 0.41 1.35 30 12.80 28.00 21.82 8.62 32.00 0.49 1.03 31 45.72 16.00 20.41 33.52 11.00 0.20 1.28 32 10.67 25.00 18.84 15.32 30.00 0.38 1.63 33 7.62 20.00 18.84 0.00 20.00 0.45 1.05 34 61.00 20.00 21.43 0.00 20.00 0.50 1.03 35 110.00 41.00 27.30 14.00 31.00 0.25 1.25 36 30.50 20.00 18.84 14.36 25.00 0.45 1.11 37 76.81 31.00 21.51 6.94 30.00 0.38 1.01 38 88.00 30.00 14.00 11.97 26.00 0.45 0.66 39 20.00 45.00 18.00 24.00 30.15 0.12 1.12 40 100.00 20.00 23.00 0.00 20.00 0.30 1.20 41 15.00 45.00 22.40 100.00 45.00 0.25 1.80 42 10.00 45.00 22.40 10.00 35.00 0.40 0.90 43 50.00 45.00 20.00 20.00 36.00 0.50 0.83 44 50.00 45.00 20.00 0.00 36.00 0.25 0.79 45 50.00 45.00 20.00 0.00 36.00 0.50 0.67 46 * 27.43 26.40 17.29 44.54 12.00 0.00 1.52 47 * 8.00 45.00 18.45 18.06 10.10 0.14 0.97 48 * 9.50 25.50 18.61 10.42 10.14 0.31 1.03 49 * 30.00 20.56 19.61 14.71 20.00 0.00 1.75 注:带*样本为测试样本. · 8·
第1期 翟淑花等:基于RSGP模型的边坡安全系数预测 9。 用GP方法进行参数预测,没有考虑数据样本的特 0.6 性,对于每一个数据样本都要进行计算,并没有考虑 05 数据的冗余和对预测结果的贡献.因此会造成计算 0.4 数据量大,计算速度慢. 22基于R的信息约简 0.2 粗糙集属性约减首先要进行属性的离散化处 0.1 理,目前属性离散化的方法很多,如等距离散、等频 划分、N年ve scale Semi n4 ve scalep以及布尔逻辑离 黏聚力孔隙水压力边坡角内摩擦角坡高 重度 系数 散法“,采用不同的离散方法对同一个问题进行处 属性 理后,所得出的决策表迥然不同,这给问题的分析带 图3属性重要性 来很大困难.因此采用基于邻域模型的前向贪心 Fig 3 Sgnificance of attrbutions 数值属性约简方法,直接处理数值型属性而无 表2遗传规划的基本参数 须对其进行离散化处理避免了因属性离散化结果 Table2 Basic parame ters of genetic Progrm ing 的不同而带来的误差.其指导思想为:以空集为起 参数 原 点,每次计算全部剩余属性的属性重要度,从中选择 目标 边坡安全系数与各个因素之间的关系表达式 属性重要度值最大的属性加入约简集合中,直到所 终止符集 变量X-X 有剩余属性的重要度为0即加入任何新的属性,系 函数集 +一,%,即0 群体规模 300 统的依赖性函数值不再发生变化.该方法能够确保 交换概率 动态 重要的属性首先被加入到约简中,从而不损失重要 突变概率 动态 的特征.基于此,计算出各属性重要度如图3所示. 选择方法 竞技选择法 由此可知,表1中所列属性均为重要属性,其属性重 终止准则 规定最大允许代次 要度大小排列顺序为黏聚力、孔隙水压力系数、边坡 最大允许代次 51 角、内摩擦角、坡高以及重度.约简消除冗余样本 最大突变深度 17 后,剩余21组训练样本,其样本编号分别为23.4 初始群体产生方法 混合法 5、810.11、12131519.20.21、2526272932. 注X为坡高。X为坡角,X为重度X为内聚力,X为内摩擦 角, 33.43和45. X为孔隙压力系数 23预测结果分析 不变的情况下,较属性约简前,遗传规划的收敛迅 将约简后的数据作为遗传规划训练样本在设 速,所得到的遗传规划的安全系数预测模型见图4 置相同的遗传规划参数(表2,并且误差训练目标 将测试样本带入遗传规划的边坡安全系数预测模 exp +G lanXX lan -Q tanX O tanX +G * 1/X +Q tan * tan tan 1/X 图4用于安全系数预测的遗传规划模型 Fg 4 Safe t factor prediction model of genetic programm ng
第 1期 翟淑花等:基于 RS--GP模型的边坡安全系数预测 用 GP方法进行参数预测, 没有考虑数据样本的特 性, 对于每一个数据样本都要进行计算 ,并没有考虑 数据的冗余和对预测结果的贡献 .因此会造成计算 数据量大 ,计算速度慢. 2.2 基于 RS的信息约简 粗糙集属性约减首先要进行属性的离散化处 理, 目前属性离散化的方法很多 ,如等距离散、等频 划分 、Naïvescale、Seminaïvescale以及布尔逻辑离 散法 [ 14] ,采用不同的离散方法对同一个问题进行处 理后 ,所得出的决策表迥然不同,这给问题的分析带 来很大困难.因此, 采用基于邻域模型的前向贪心 数值属性约简 [ 15] 方法, 直接处理数值型属性, 而无 须对其进行离散化处理, 避免了因属性离散化结果 的不同而带来的误差 .其指导思想为:以空集为起 点, 每次计算全部剩余属性的属性重要度,从中选择 属性重要度值最大的属性加入约简集合中, 直到所 有剩余属性的重要度为 0, 即加入任何新的属性, 系 统的依赖性函数值不再发生变化 .该方法能够确保 重要的属性首先被加入到约简中 , 从而不损失重要 的特征.基于此 ,计算出各属性重要度如图 3所示. 由此可知 ,表 1中所列属性均为重要属性,其属性重 要度大小排列顺序为黏聚力 、孔隙水压力系数、边坡 角、内摩擦角 、坡高以及重度.约简消除冗余样本 后,剩余 21组训练样本, 其样本编号分别为 2、3、4、 5、8、10、11、12、13、15、19、20、21、25、26、27、29、32、 33、43和 45. 2.3 预测结果分析 将约简后的数据作为遗传规划训练样本, 在设 置相同的遗传规划参数 (表 2), 并且误差训练目标 图 3 属性重要性 Fig.3 Significanceofattributions 表 2 遗传规划的基本参数 Table2 Basicparametersofgeneticprogramming 参数 值 目标 边坡安全系数与各个因素之间的关系表达式 终止符集 变量 X1 -X6 函数集 +, -, *, tan, exp 群体规模 300 交换概率 动态 突变概率 动态 选择方法 竞技选择法 终止准则 规定最大允许代次 最大允许代次 51 最大突变深度 17 初始群体产生方法 混合法 注:X1为坡高, X2为坡角, X3为重度, X4为内聚力, X5为内摩擦 角, X6为孔隙压力系数. 不变的情况下 , 较属性约简前, 遗传规划的收敛迅 速 ,所得到的遗传规划的安全系数预测模型见图 4. 将测试样本带入遗传规划的边坡安全系数预测模 图 4 用于安全系数预测的遗传规划模型 Fig.4 Safetyfactorpredictionmodelofgeneticprogramming · 9·
。10 北京科技大学学报 第33卷 型,并与神经网络(AN)预测结果作对比表3). laton based on rough set and artificial neurn nework Syst Eng 结果显示,基于粗糙集的遗传规划的边坡安全系数 Theory Pmct 2005 25(7):81 (任洪德,马云东.基于粗糙集神经网络的矿井通风系统可靠 预测精度要优于神经网络预测方法.由此可见。利 性评价仿真研究.系统工程理论与实践.200525(7):81) 用粗糙集理论去掉冗余样本,可以大大提高训练样 ZhaoX Q Cao X Y Lan ZQ etal Study of theme thal fr de 本的有效性和可靠性,从而提高遗传规划学习效率 temning we thting coefficient of coal ah slagging fuzzy conbina 和预测精度 tion forecast based on rough set theory J China Coal Sos 2004 29(2)片222 表3边坡安全系数预测结果对比表 Table 3 Comparison of he predic ted va lues of sppe safety facor 赵显桥,曹欣玉,兰泽全,等.基于粗集理论的煤灰结渣模糊 综合评判叔系数确定方法研究.煤炭学报.200429(2:222) ANN ANN预测 RS-GP RS-GP预测 [7Yu HC Lu H D Yu HM Appl ication of xugh set sensitivity 序号实际值 预测值 相对误差%预测值相对误差% analysis of nfluenc ing facors for sppe stbility based a FCM 46 1.52 1.43 6.00 1.49 2.00 agoritm Rock SoilMe 2008 29(7):1889 47 0.97 0.95 200 096 1.00 于怀昌,刘汉东,余宏明。等.基于FM算法的粗糙集理论在 边坡稳定性影响因素敏感性分析中的应用.岩土力学,20⑧ 48 1.03 0.93 9.70 102 1.30 29(7):1889) 49 1.75 1.63 680 170 3.00 I8 ZhangQ S GaoY F Lu SY et al Sudy on rock movement fac tors and subsidence pedictionme thad based on rough set theory 3结论 and anificial neumlnewos J China CoalSoc 2004 29(1):2 张庆松,高延法,刘松玉,等.基于粗集与神经网络相结合的 建立了边坡安全系数预测模型,利用粗糙集遗 岩移影响因素分析与开采沉陷预计方法研究.煤炭学报, 200429(122) 传规划方法对边坡安全系数进行离线预测.通过实 [9 Zhang P Chen J P Qu D H Evalun tion of tunnel surounding 例计算,证明该方法可以有效地约简系统冗余信息, oock qua lity with extenics based on ough set Roc Spil Mech 减少数据量,提高计算速度.对于大型复杂非线性 200930(1)片246 系统,该方法可以快速寻找到对非线性系统参数预 张鹏陈剑平,邱道宏.基于粗糙集的隧道围岩质量可拓学评 测贡献较大的信息,在非线性系统分析上具有很强 价.岩土力学,200930(1):246) 的适用性. 10]ZhaiSH GaoQ Song JG Genetic Programming appronch for Predic ting sirface subsience induced by mining I China Univ 参考文献 G09i200617(4片361 I11]Zhai SH GaoQ APPlication ofgene tic Pgramm ing on Predic II]LiK G HouK P LiW.Research an nfluences of fc ors dy tingmaxmum surface subsidence due o mining J China Coal nam ic weight on sppe stabilit Rock SoilMec 200 30(2) 9,9200732(3片239 492 (程淑花高谦.遗传规划在最大下沉值预测中的应用.煤炭 (李克钢,侯克鹏李旺指标动态权重对边坡稳定性的影响研 学报。200732(3):239) 究.岩土力学,200930(2:492) [12]Cao JG NeumlNework and AnifidalMoeling ofSppe Stabilit [2 LiuM Y Zhu R G Case_based reasoning approach o sppe st 【Disemtia码.Ok ham经UnMersit0 ofOk khamg200243 bility evaluatin based on fuzzy anapgy Prefemed ratio Chn J I 13]XiongH F Resea ches on evalation of he sppe stability based RockMech Eng 2002 21(8 )1188 on artificial neural network techno kgy Dissertation.Wuhan (刘沐宇,朱瑞赓.基于模糊相似优先的边坡稳定性评价范例 Wuhan Un versity ofTechnokgy 2003 62 推理方法.岩石力学与工程学报.200221(8):1188) (熊海丰.基于人工神经网络技术的边坡稳定性评价研究[学 [3 LiuD L Ta GH LiQG et al The stability of rock skpe and 位论文].武汉:武汉理工大学,200362) fzzy con prehensive eva juation method Chin J RockMech Eng 14]MioDQ LiD G Rough Set Theory Agoritm and APplica 199918(2:170 tin Beijng Tsinghua University Press 2008 1 (刘端伶,谭国焕李启光等.岩石边坡稳定性和Fz踪合评 苗夺谦李道国.粗糙集理论、算法与应用.北京:清华大学 判法.岩石力学与工程学报。199918(2,170) 出版社,20081) [4 ZhaoH B Ferg X T Applicatin of support vecor mach nes [15]Hu QH Yu D B Xe ZX Numerical attribute reducton based funct ion fittng in sppe stabilit evalution Chin J RockMech Eng on ne ghborhood granu lation and ough approx mation J Soft 200322(2:241 wa9200819(3:640 (赵洪波,冯夏庭.支持向量机函数拟和在边坡稳定性估计中 (胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值 的应用.岩石力学与工程学报。200322(2),:24) 5]WangHD Ma Y D Sudy on ventilation systm evalun tion smu 属性约简.软件学报。200819(3:640)
北 京 科 技 大 学 学 报 第 33卷 型, 并与神经网络 (ANN)预测结果作对比 (表 3). 结果显示 ,基于粗糙集的遗传规划的边坡安全系数 预测精度要优于神经网络预测方法.由此可见, 利 用粗糙集理论去掉冗余样本, 可以大大提高训练样 本的有效性和可靠性 ,从而提高遗传规划学习效率 和预测精度. 表 3 边坡安全系数预测结果对比表 Table3 Comparisonofthepredictedvaluesofslopesafetyfactor 序号 实际值 ANN 预测值 ANN预测 相对误差 /% RS--GP 预测值 RS-GP预测 相对误差/% 46 1.52 1.43 6.00 1.49 2.00 47 0.97 0.95 2.00 0.96 1.00 48 1.03 0.93 9.70 1.02 1.30 49 1.75 1.63 6.80 1.70 3.00 3 结论 建立了边坡安全系数预测模型, 利用粗糙集遗 传规划方法对边坡安全系数进行离线预测.通过实 例计算,证明该方法可以有效地约简系统冗余信息, 减少数据量, 提高计算速度 .对于大型复杂非线性 系统 ,该方法可以快速寻找到对非线性系统参数预 测贡献较大的信息 ,在非线性系统分析上具有很强 的适用性 . 参 考 文 献 [ 1] LiKG, HouKP, LiW.Researchoninfluencesoffactorsdynamicweightonslopestability.RockSoilMech, 2009, 30(2): 492 (李克钢, 侯克鹏, 李旺.指标动态权重对边坡稳定性的影响研 究.岩土力学, 2009, 30(2):492) [ 2] LiuMY, ZhuRG.Case-basedreasoningapproachtoslopestabilityevaluationbasedonfuzzyanalogypreferredratio.ChinJ RockMechEng, 2002, 21(8):1188 (刘沐宇, 朱瑞赓.基于模糊相似优先的边坡稳定性评价范例 推理方法.岩石力学与工程学报, 2002, 21(8):1188) [ 3] LiuDL, TanGH, LiQG, etal.Thestabilityofrockslopeand fuzzycomprehensiveevaluationmethod.ChinJRockMechEng, 1999, 18(2):170 (刘端伶, 谭国焕, 李启光, 等.岩石边坡稳定性和 Fuzzy综合评 判法.岩石力学与工程学报, 1999, 18(2):170) [ 4] ZhaoH B, FengXT.Applicationofsupportvectormachines functionfittinginslopestabilityevalution.ChinJRockMechEng, 2003, 22(2):241 (赵洪波, 冯夏庭.支持向量机函数拟和在边坡稳定性估计中 的应用.岩石力学与工程学报, 2003, 22(2):241) [ 5] WangHD, MaYD.Studyonventilationsystemevaluationsimulationbasedonroughsetandartificialneuronnetwork.SystEng TheoryPract, 2005, 25(7):81 (王洪德, 马云东.基于粗糙集-神经网络的矿井通风系统可靠 性评价仿真研究.系统工程理论与实践, 2005, 25(7):81) [ 6] ZhaoXQ, CaoXY, LanZQ, etal.Studyofthemethodfordeterminingweightingcoefficientofcoalashslaggingfuzzycombinationforecastbasedonroughsettheory.JChinaCoalSoc, 2004, 29(2):222 (赵显桥, 曹欣玉, 兰泽全, 等.基于粗集理论的煤灰结渣模糊 综合评判权系数确定方法研究.煤炭学报, 2004, 29(2):222) [ 7] YuHC, LiuHD, YuHM.Applicationofroughsetsensitivity analysisofinfluencingfactorsforslopestabilitybasedonFCM algorithm.RockSoilMech, 2008, 29(7):1889 (于怀昌, 刘汉东, 余宏明, 等.基于 FCM算法的粗糙集理论在 边坡稳定性影响因素敏感性分析中的应用.岩土力学, 2008, 29(7):1889) [ 8] ZhangQS, GaoYF, LiuSY, etal.Studyonrockmovement factorsandsubsidencepredictionmethodbasedonrough-settheory andartificialneuralnetwork.JChinaCoalSoc, 2004, 29(1):22 (张庆松, 高延法, 刘松玉, 等.基于粗集与神经网络相结合的 岩移影响因素分析与开采沉陷预计方法研究.煤炭学报, 2004, 29(1):22) [ 9] ZhangP, ChenJP, QiuDH.Evaluationoftunnelsurrounding rockqualitywithextenicsbasedonroughset.RockSoilMech, 2009, 30(1):246 (张鹏, 陈剑平, 邱道宏.基于粗糙集的隧道围岩质量可拓学评 价.岩土力学, 2009, 30(1):246) [ 10] ZhaiSH, GaoQ, SongJG.Geneticprogrammingapproachfor predictingsurfacesubsidenceinducedbymining.JChinaUniv Geosci, 2006, 17(4):361 [ 11] ZhaiSH, GaoQ.Applicationofgeneticprogrammingonpredictingmaximumsurfacesubsidenceduetomining.JChinaCoal Soc, 2007, 32(3):239 (翟淑花, 高谦.遗传规划在最大下沉值预测中的应用.煤炭 学报, 2007, 32(3):239) [ 12] CaoJG.NeuralNetworkandArtificialModelingofSlopeStability [ Dissertation] .Oklahoma:UniversityofOklahoma, 2002:43 [ 13] XiongHF.Researchesonevaluationoftheslopestabilitybased onartificialneuralnetworktechnology[ Dissertation] .Wuhan: WuhanUniversityofTechnology, 2003:62 (熊海丰.基于人工神经网络技术的边坡稳定性评价研究[ 学 位论文] .武汉:武汉理工大学, 2003:62) [ 14] MiaoDQ, LiDG.RoughSetTheory, AlgorithmandApplication.Beijing:TsinghuaUniversityPress, 2008:1 (苗夺谦, 李道国.粗糙集理论、算法与应用.北京:清华大学 出版社, 2008:1) [ 15] HuQH, YuDR, XieZX.Numericalattributereductionbased onneighborhoodgranulationandroughapproximation.JSoftware, 2008, 19(3):640 (胡清华, 于达仁, 谢宗霞.基于邻域粒化和粗糙逼近的数值 属性约简.软件学报, 2008, 19(3):640) · 10·