工程科学学报 Chinese Journal of Engineering 基于机器学习的边坡安全稳定性评价及防护措施 武梦婷陈秋松齐冲冲 Slope safety,stability evaluation,and protective measures based on machine learning WU Meng-ting.CHEN Qiu-song.QI Chong-chong 引用本文: 武梦婷,陈秋松,齐冲冲.基于机器学习的边坡安全稳定性评价及防护措施.工程科学学报,2022,442):180-188.doi: 10.13374j.issn2095-9389.2021.06.02.008 WU Meng-ting,CHEN Qiu-song.QI Chong-chong.Slope safety,stability evaluation,and protective measures based on machine learning[J].Chinese Journal of Engineering,2022,44(2):180-188.doi:10.13374/j.issn2095-9389.2021.06.02.008 在线阅读View online::htps:/ldoi.org/10.13374.issn2095-9389.2021.06.02.008 您可能感兴趣的其他文章 Articles you may be interested in 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报.2019,41(3:401 https:/1doi.org10.13374.issn2095-9389.2019.03.014 基于支持向量回归与极限学习机的高炉铁水温度预测 Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine 工程科学学报.2021,43(4:569htps:/doi.org10.13374.issn2095-9389.2020.05.28.001 基于监督学习的前列腺MR/TRUS图像分割和配准方法 Prostate MR/TRUS image segmentation and registration methods based on supervised learning 工程科学学报.2020,42(10:1362htps:1doi.org10.13374.issn2095-9389.2019.10.10.006 三维软硬互层边坡的破坏模式与稳定性研究 Numerical analysis of the failure modes and stability of 3D slopes with interbreeding of soft and hard rocks 工程科学学报.2017,392:182 https:oi.org10.13374j.issn2095-9389.2017.02.003 油气资源开发的大数据智能平台及应用分析 Big data intelligent platform and application analysis for oil and gas resource development 工程科学学报.2021,432:179 https::/1doi.org/10.13374.issn2095-9389.2020.07.21.001
基于机器学习的边坡安全稳定性评价及防护措施 武梦婷 陈秋松 齐冲冲 Slope safety, stability evaluation, and protective measures based on machine learning WU Meng-ting, CHEN Qiu-song, QI Chong-chong 引用本文: 武梦婷, 陈秋松, 齐冲冲. 基于机器学习的边坡安全稳定性评价及防护措施[J]. 工程科学学报, 2022, 44(2): 180-188. doi: 10.13374/j.issn2095-9389.2021.06.02.008 WU Meng-ting, CHEN Qiu-song, QI Chong-chong. Slope safety, stability evaluation, and protective measures based on machine learning[J]. Chinese Journal of Engineering, 2022, 44(2): 180-188. doi: 10.13374/j.issn2095-9389.2021.06.02.008 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2021.06.02.008 您可能感兴趣的其他文章 Articles you may be interested in 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报. 2019, 41(3): 401 https://doi.org/10.13374/j.issn2095-9389.2019.03.014 基于支持向量回归与极限学习机的高炉铁水温度预测 Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine 工程科学学报. 2021, 43(4): 569 https://doi.org/10.13374/j.issn2095-9389.2020.05.28.001 基于监督学习的前列腺MR/TRUS图像分割和配准方法 Prostate MR/TRUS image segmentation and registration methods based on supervised learning 工程科学学报. 2020, 42(10): 1362 https://doi.org/10.13374/j.issn2095-9389.2019.10.10.006 三维软硬互层边坡的破坏模式与稳定性研究 Numerical analysis of the failure modes and stability of 3D slopes with interbreeding of soft and hard rocks 工程科学学报. 2017, 39(2): 182 https://doi.org/10.13374/j.issn2095-9389.2017.02.003 油气资源开发的大数据智能平台及应用分析 Big data intelligent platform and application analysis for oil and gas resource development 工程科学学报. 2021, 43(2): 179 https://doi.org/10.13374/j.issn2095-9389.2020.07.21.001
工程科学学报.第44卷.第2期:180-188.2022年2月 Chinese Journal of Engineering,Vol.44,No.2:180-188,February 2022 https://doi.org/10.13374/j.issn2095-9389.2021.06.02.008;http://cje.ustb.edu.cn 基于机器学习的边坡安全稳定性评价及防护措施 武梦婷,陈秋松,齐冲冲四 中南大学资源与安全工程学院,长沙410083 ☒通信作者,E-mail:chongchong.qi@csu.edu.cn 摘要为了更加快捷、高效地判定边坡稳定与否,基于机器学习,融合主成分分析法(P℃A)、参数调整、影响因素权重分析 等,建立了一种边坡安全稳定性评价体系.研究发现,运用PCA可以在保留80%数据原信息的前提下将输人变量维度从六 维降至三维,但此时模型效果有所下降:随机森林及梯度提升(XGBo0s)两种学习算法均可搭建有效的边坡安全稳定性评估 模型,通过对其预测效果的对比分析,确定XGBo0s为最佳评价模型.与此同时,采取卡方检验、F检验以及互信息法3种相 关性检验手段,并通过计算评价因子的重要程度且加以可视化展示,明确了容重、坡高、内摩擦角以及内聚力4个内在因素 的重要性,最终将评估结果与实际结合提出了边坡安全防护措施. 关键词边坡稳定性评价:机器学习;随机森林:XGBoost:防护措施 分类号X936 Slope safety,stability evaluation,and protective measures based on machine learning WU Meng-ting.CHEN Qiu-song.QI Chong-chong School of Resources and Safety Engineering.Central South University,Changsha410083,China Corresponding author,E-mail:chongchong.qi@csu.edu.cn ABSTRACT In recent years,the slope instability has brought immeasurable costs to production and life of human.As a result,it is essential to correctly understand,analyze,and design the slope reasonably,and implement appropriate protective measures to minimize the loss and harm caused by its instability.By far,slope stability can be investigated using theoretical analysis,numerical modeling and machine learning prediction,among them machine learning prediction has been the most encouraging one.Many studies have been performed using machine learning algorithms to predict the slope stability.However,these methods suffers from poor accuracy and poor generalisation capbility,so its real-life application has been limited.In the current study,a machine learning-based slope safety and stability evaluation system is established by integrating principal component analysis,parameter adjustment,and influence factor weight analysis.It is shown that PCA can reduce the dimensions of the input variables from six to three while retaining 80%of the information; however,at the cost of the model's effectiveness.The random forest and XGBoost(eXtreme Gradient Boosting)learning algorithms can both be employed to develop effective evaluation models for slope safety and stability.The comparative analysis of algorithms' prediction effects established XGBoost as the best evaluation model,which can achieve the average accuracy of 92%,precision of91%, recall of 96%,and the area under the receiver operating characteristic curve (AUC)of 0.95.In addition,this study employs three types of test methods:the chi-square test,F test correlation,and mutual information method,meanwhile by calculating and visualizing the importance of influencing factors,the influence of unit weight,slope height,internal friction angle and cohesion on slope stability is demonstrated.It has been shown that the unit weight is the most influencing factor for the slope stability.Finally,the slope safety protection measures are proposed by combining the evaluation results with the actual project. KEY WORDS slope stability evaluation;machine learning;random forest;XGBoost;protective measures 收稿日期:2021-06-02 基金项目:中央高校基本科研业务费专项资金资助项目(202045009):国家自然科学基金资助项目(52074351)
基于机器学习的边坡安全稳定性评价及防护措施 武梦婷,陈秋松,齐冲冲苣 中南大学资源与安全工程学院, 长沙 410083 苣通信作者, E-mail: chongchong.qi@csu.edu.cn 摘 要 为了更加快捷、高效地判定边坡稳定与否,基于机器学习,融合主成分分析法(PCA)、参数调整、影响因素权重分析 等,建立了一种边坡安全稳定性评价体系. 研究发现,运用 PCA 可以在保留 80% 数据原信息的前提下将输入变量维度从六 维降至三维,但此时模型效果有所下降;随机森林及梯度提升 (XGBoost) 两种学习算法均可搭建有效的边坡安全稳定性评估 模型,通过对其预测效果的对比分析,确定 XGBoost 为最佳评价模型. 与此同时,采取卡方检验、F 检验以及互信息法 3 种相 关性检验手段,并通过计算评价因子的重要程度且加以可视化展示,明确了容重、坡高、内摩擦角以及内聚力 4 个内在因素 的重要性,最终将评估结果与实际结合提出了边坡安全防护措施. 关键词 边坡稳定性评价;机器学习;随机森林;XGBoost;防护措施 分类号 X936 Slope safety, stability evaluation, and protective measures based on machine learning WU Meng-ting,CHEN Qiu-song,QI Chong-chong苣 School of Resources and Safety Engineering, Central South University, Changsha 410083, China 苣 Corresponding author, E-mail: chongchong.qi@csu.edu.cn ABSTRACT In recent years, the slope instability has brought immeasurable costs to production and life of human. As a result, it is essential to correctly understand, analyze, and design the slope reasonably, and implement appropriate protective measures to minimize the loss and harm caused by its instability. By far, slope stability can be investigated using theoretical analysis, numerical modeling and machine learning prediction, among them machine learning prediction has been the most encouraging one. Many studies have been performed using machine learning algorithms to predict the slope stability. However, these methods suffers from poor accuracy and poor generalisation capbility, so its real-life application has been limited. In the current study, a machine learning-based slope safety and stability evaluation system is established by integrating principal component analysis, parameter adjustment, and influence factor weight analysis. It is shown that PCA can reduce the dimensions of the input variables from six to three while retaining 80% of the information; however, at the cost of the model’s effectiveness. The random forest and XGBoost (eXtreme Gradient Boosting) learning algorithms can both be employed to develop effective evaluation models for slope safety and stability. The comparative analysis of algorithms ’ prediction effects established XGBoost as the best evaluation model, which can achieve the average accuracy of 92%, precision of 91%, recall of 96%, and the area under the receiver operating characteristic curve (AUC) of 0.95. In addition, this study employs three types of test methods: the chi-square test, F test correlation, and mutual information method, meanwhile by calculating and visualizing the importance of influencing factors, the influence of unit weight, slope height, internal friction angle and cohesion on slope stability is demonstrated. It has been shown that the unit weight is the most influencing factor for the slope stability. Finally, the slope safety protection measures are proposed by combining the evaluation results with the actual project. KEY WORDS slope stability evaluation;machine learning;random forest;XGBoost;protective measures 收稿日期: 2021−06−02 基金项目: 中央高校基本科研业务费专项资金资助项目(202045009);国家自然科学基金资助项目(52074351) 工程科学学报,第 44 卷,第 2 期:180−188,2022 年 2 月 Chinese Journal of Engineering, Vol. 44, No. 2: 180−188, February 2022 https://doi.org/10.13374/j.issn2095-9389.2021.06.02.008; http://cje.ustb.edu.cn
武梦婷等:基于机器学习的边坡安全稳定性评价及防护措施 181· 关于边坡灾害事故的防治,首先要做的就是 针对以上问题,本文在使用归一化处理对数 对边坡的安全稳定状态进行合理分析与评价,这 据质量进行改善后,采用了随机森林以及XGBoost 也是边坡防治工程的核心与重点.目前,评估边坡 两种学习算法搭建边坡安全稳定性评估模型,在 是否安全稳定最常采取的还是定性分析以及定量 对其预测效果进行对比后确定最终评价模型.此 求解等传统手段.但边坡作为一个动态开环系统, 外,还增加了建模前的特征工程以及建模后的特 其难以确定的安全影响因子很多,且大多具有参 征重要性分析步骤,得出评价因子的影响权重后, 数模糊以及随机可变等特点,因此,传统手段应用 将评估结果与实际结合提出了边坡安全防护措施 起来都有相对的局限性.而随着研究的深入,确定 1方法原理 性与不确定分析相联合、通过物理模拟构建离心 模型等也成为边坡研究的新途径,但上述方法尚 1.1 PCA 存在一些未解决的问题,方法结果的实际可信度 PCA是一种使用线性代数来转换压缩数据的 有所降低 技术手段.其通过将线性相关的多个指标重组成 随着机器学习技术的快速兴起,为边坡安全 一组数量较少且相互独立的综合指标,来实现在 稳定性研究提出了一种新思路.国内外学者开始 减少特征数量的同时,保留大量有用信息2-降 将决策树山、随机森林、支持向量机2-以及朴素 维过程中所使用的衡量指标是样本方差,方差越 贝叶斯等算法广泛应用于边坡研究中.Neuland 大,说明特征含有的有效信息越多,对于模型的创 通过收集分析250个边坡数据,明确了31处变量, 建能够有所贡献.方差的计算公式见式(1): 并借助主成分分析方法(PCA)解释了其间的函数 1 关系,从而构建了一个评估边坡是否稳定的算法 Var= n-l (-)2 (1) 模型,且在测试数据中泛化能力较好Pradhan 与L借助逆向传播的神经网络,对巴生谷地区的 其中,Var代表方差;n代表样本总数;x代表每一 个特征的第i个样本值:代表对应某一个特征的 边坡进行了研究,计算了坡率、坡高等11个相关 所有样本的平均值 影响因素的权重值,计算结果显示人工神经网络 (ANN)优于先前采用手段m.Alavi与Gandomi利 PCA降维的核心原理是在确定方差数值排列 用遗传算法对岩土边坡的具体问题进行了研究剧 前二的数据方向后,使用类比的方法将全部主成 Martins与Miranda进行了多次逻辑回归,并采用 分的方向予以确定,然后通过分解协方差矩阵得 随机森林、K近邻算法以及决策树等多种方法途 出其特征向量及特征值,从而实现将初始数据压 径来探索边坡的稳定状态四.赵洪波基于极限平衡 缩映射至新的低维空间,并保证总信息量损失较 少.具体实施步骤如下: 创建学习样本,并将一阶二次矩应用于支持向量 机中对边坡可靠性进行分析研究,陈善攀在对 (1)输入b条a维数据构成样本集X=(x四, 边坡进行可靠性分析时,提出了能够精确计算边 x②,…,x),其中a代表特征个数; 坡可靠评估标准并同步搜寻最危滑体的算法,并 (2)将x四②,…,x进行归一化处理,得到矩 借助面向对象进行了边坡稳定系统编码山 阵X; 尽管上述学者应用机器学习在边坡领域已取 (3)求解出协方差矩阵C=xX,以及其特征 得了些许成果,但其研究尚存在以下不足:①由于 值和特征向量; 评价因子数量较少,采用压缩、转换数据构建模型 (4)将特征值由大到小排序后,取出与之对应 的手段并不常见,且对于PCA法在边坡问题中的 的前g个特征向量组成新特征空间; 适用性与可行性也从未进行详细探究;②文献中 (5)Y=VTX即为特征降到g维的新的样本集 使用诸如梯度提升算法(XGBoost)等快速更新的 1.2 XGBoost 先进评估器对边坡稳定性进行预测的尝试不多, XGBoost是一种利用正则项等手段来简化模 且构建多种模型进行对比研究的方式也相对较 型,使其具有高精度、高效率以及较高预测准确率 少;③影响因素的权重分析不够全面,缺少基于相 的提升算法.该算法以梯度提升算法为基础,通过 关性检验的权重分析与基于智能模型的权重分析 不断添加决策树并进行特征分解来学习新函数, 的综合对比:④未对评价结果进行深入考虑及合 从而拟合残留的预测误差;当k棵树训练完毕后 理部署,缺少智能驱动的边坡安全防护措施 可根据样本特征计算叶子节点分数,通过累加得
关于边坡灾害事故的防治,首先要做的就是 对边坡的安全稳定状态进行合理分析与评价,这 也是边坡防治工程的核心与重点. 目前,评估边坡 是否安全稳定最常采取的还是定性分析以及定量 求解等传统手段. 但边坡作为一个动态开环系统, 其难以确定的安全影响因子很多,且大多具有参 数模糊以及随机可变等特点,因此,传统手段应用 起来都有相对的局限性. 而随着研究的深入,确定 性与不确定分析相联合、通过物理模拟构建离心 模型等也成为边坡研究的新途径. 但上述方法尚 存在一些未解决的问题,方法结果的实际可信度 有所降低. 随着机器学习技术的快速兴起,为边坡安全 稳定性研究提出了一种新思路. 国内外学者开始 将决策树[1]、随机森林、支持向量机[2−4] 以及朴素 贝叶斯[5] 等算法广泛应用于边坡研究中. Neuland 通过收集分析 250 个边坡数据,明确了 31 处变量, 并借助主成分分析方法 (PCA) 解释了其间的函数 关系,从而构建了一个评估边坡是否稳定的算法 模型,且在测试数据中泛化能力较好[6] . Pradhan 与 Li 借助逆向传播的神经网络,对巴生谷地区的 边坡进行了研究,计算了坡率、坡高等 11 个相关 影响因素的权重值,计算结果显示人工神经网络 (ANN) 优于先前采用手段[7] . Alavi 与 Gandomi 利 用遗传算法对岩土边坡的具体问题进行了研究[8] . Martins 与 Miranda 进行了多次逻辑回归,并采用 随机森林、K 近邻算法以及决策树等多种方法途 径来探索边坡的稳定状态[9] . 赵洪波基于极限平衡 创建学习样本,并将一阶二次矩应用于支持向量 机中对边坡可靠性进行分析研究[10] . 陈善攀在对 边坡进行可靠性分析时,提出了能够精确计算边 坡可靠评估标准并同步搜寻最危滑体的算法,并 借助面向对象进行了边坡稳定系统编码[11] . 尽管上述学者应用机器学习在边坡领域已取 得了些许成果,但其研究尚存在以下不足:①由于 评价因子数量较少,采用压缩、转换数据构建模型 的手段并不常见,且对于 PCA 法在边坡问题中的 适用性与可行性也从未进行详细探究;②文献中 使用诸如梯度提升算法 (XGBoost) 等快速更新的 先进评估器对边坡稳定性进行预测的尝试不多, 且构建多种模型进行对比研究的方式也相对较 少;③影响因素的权重分析不够全面,缺少基于相 关性检验的权重分析与基于智能模型的权重分析 的综合对比;④未对评价结果进行深入考虑及合 理部署,缺少智能驱动的边坡安全防护措施. 针对以上问题,本文在使用归一化处理对数 据质量进行改善后,采用了随机森林以及 XGBoost 两种学习算法搭建边坡安全稳定性评估模型,在 对其预测效果进行对比后确定最终评价模型. 此 外,还增加了建模前的特征工程以及建模后的特 征重要性分析步骤,得出评价因子的影响权重后, 将评估结果与实际结合提出了边坡安全防护措施. 1 方法原理 1.1 PCA PCA 是一种使用线性代数来转换压缩数据的 技术手段. 其通过将线性相关的多个指标重组成 一组数量较少且相互独立的综合指标,来实现在 减少特征数量的同时,保留大量有用信息[12−14] . 降 维过程中所使用的衡量指标是样本方差,方差越 大,说明特征含有的有效信息越多,对于模型的创 建能够有所贡献. 方差的计算公式见式(1): Var = 1 n−1 ∑n i = 1 (xi − xˆ) 2 (1) xi xˆ 其中,Var 代表方差;n 代表样本总数; 代表每一 个特征的第 i 个样本值; 代表对应某一个特征的 所有样本的平均值. PCA 降维的核心原理是在确定方差数值排列 前二的数据方向后,使用类比的方法将全部主成 分的方向予以确定,然后通过分解协方差矩阵得 出其特征向量及特征值,从而实现将初始数据压 缩映射至新的低维空间,并保证总信息量损失较 少. 具体实施步骤如下: ··· , x ( 1) 输 入 b 条 a 维数据构成样本 集 X=( x (1) , x (2) , (b) ),其中 a 代表特征个数; (2)将 x ··· , x (1) ,x (2) , (b) 进行归一化处理,得到矩 阵 X 1 ; C = 1 b XXT (3)求解出协方差矩阵 ,以及其特征 值和特征向量; (4)将特征值由大到小排序后,取出与之对应 的前 q 个特征向量组成新特征空间 V; Y = V TX 1 (5) 即为特征降到 q 维的新的样本集. 1.2 XGBoost XGBoost 是一种利用正则项等手段来简化模 型,使其具有高精度、高效率以及较高预测准确率 的提升算法. 该算法以梯度提升算法为基础,通过 不断添加决策树并进行特征分解来学习新函数, 从而拟合残留的预测误差;当 k 棵树训练完毕后 可根据样本特征计算叶子节点分数,通过累加得 武梦婷等: 基于机器学习的边坡安全稳定性评价及防护措施 · 181 ·
.182 工程科学学报,第44卷.第2期 到样本的预测值.XGBoost模型构建主要分为以 定了随机森林算法预测准确性的高低. 下四个步骤: 随机森林模型搭建的基本思路如下:①从数 (1)建立目标函数并求取最优解.如式(2)所 据集中有放回的随机抽取b个样本1:②随机选 示,目标函数=传统损失函数+模型复杂度 取α个特征并利用这些特征对所选取的样本进行 决策树的构建:③将步骤①和②重复:次生成:棵 (2) 决策树,组合形成随机森林:④利用随机森林中的 =1 k=1 z棵树对新数据进行判断,最后投票确认所属类别. 其中,i表数据集中的第i个样本;m表示导入第 k棵树的数据总量;K代表建立的所有树:O,)是 2 边坡稳定性预测模型 模型的损失函数,用于评估分类器的概率输出, 2.1样本数据集数据分析 表示真实标签:表示预测值:龙)是全部 收集整理数据集是建立机器学习预测模型的 k=1 K棵树的复杂度求和,f表示第k棵决策树,Ω表示 第一步.在实际工程领域中,对于一个具体的问题, 树模型的某种变换 使用网络公开的一些合理且具有代表性的数据集, (2)利用泰勒公式将目标函数展开后对其进 其预测结果更具有说服力.因此,本文收集了168 行整合、重组,使其转化为与预测残差相关的多项 个坡度剖面的数据集,该数据集由文献[19-23]中 式,如式(3)所示; 的不同论文汇编而成,并已广泛用于边坡稳定性 预测,其统计特征如图1所示.其中,N代表边坡 [.D) 样本的总数量,Mean和Std分别代表着每一个特 征的均值和标准差,Min和Max为对应特征的最 f8:+fh,]+0) (3) 小值和最大值,Med为特征的中位数 2.2预测模型建立流程 其中,1y,-+f(x)是x)对应的损失函数,其 (1)数据预处理.数据的质量影响着机器学习 中y表示第1棵树的真实标签,-是第1步模 模型的性能,决定了算法所能达到的模型上限 型给出的预测值,f(x)是第1棵树的模型;和h分 分析图1可知,原始数据集的孔隙水压力因子存 别是损失函数的一阶和二阶导数 在异常值,因此,应将该样本进行删除清理,最终 (3)基于目标函数,采取某种手段将树的结构 保留167条数据.又因原始数据为连续型变量,存 优化,最终转变为的结构分数如式(4)所示: 在数据尺度、量纲不统一等问题.对此本文使用 T c 归一化处理的手段对数据进行转换,并将处理完 0oj=-2H++7 (4) 毕的数据应用于算法,来提高模型算法的准确度. jl (2)建模因子的初步确定及筛选.本文收集的 其中,y和入为提前设定的超参数;T表示叶子数 数据集中包含了对边坡稳定性影响最大的一些参 量;G和H由损失函数和特定结构下树的预测结 数:几何形状、重力、地质力学参数和土壤中的水 果共同决定:结构分数Ob越小表示树越优化 量.对这些参数进行分析,初步确定了边坡高度、 (4)树的结构确定后,借助贪心算法来实现树 边坡角、孔隙压力比、容重、内聚力和内摩擦角 的分裂并求取算法模型的局部最优解阿 6个建模因子后,借助方差过滤手段来删除方差值 1.3随机森林 为0且对样本区分没有价值的特征.然后再使用 为验证XGBoost算法的高精度与高效率,基 卡方检验、F检验以及互信息法3种相关性检验 于先前研究成果6,本文选取了预测准确率较高 的方法对建模因子进行筛选 的随机森林算法进行对比. (3)PCA降维.为了对比不同特征工程手段对 随机森林是集成学习并行模式中的一种十分 于预测模型准确率的影响,本文还采用PCA降维 典型的机器学习算法.该算法以单独的决策树作 算法对特征进行处理,创造具有不可读性的全新 为弱学习器,且弱学习器间互不依赖,其原理是将 特征.此外,考虑到保留特征过多达不到降维效 Bagging袋装集成作为理论基础,在对决策树进行 果,以及留下特征较少,新特征向量无法容纳初始 独立训练时利用随机种子来进行抉择)针对袋 数据的大部分信息等弊端,本文借助累积可解释 装法,由于集成结果依赖于少数服从多数及平均 方差贡献率曲线及最大似然估计自动选取降维参 值准则,所以独立决策树的预测正确与否直接决 数n_components的最佳取值,并基于此查看模型
到样本的预测值. XGBoost 模型构建主要分为以 下四个步骤: (1)建立目标函数并求取最优解. 如式(2)所 示,目标函数=传统损失函数+模型复杂度. Obj = ∑m i=1 l(yi , yˆi)+ ∑ K k=1 Ω(fk) (2) l(yi , yˆi) yi yˆi ∑ K k=1 Ω(fk) fk Ω 其中,i 表数据集中的第 i 个样本;m 表示导入第 k 棵树的数据总量;K 代表建立的所有树; 是 模型的损失函数,用于评估分类器的概率输出, 表示真实标签 ; 表示预测值 ; 是 全 部 K 棵树的复杂度求和, 表示第 k 棵决策树, 表示 树模型的某种变换. (2)利用泰勒公式将目标函数展开后对其进 行整合、重组,使其转化为与预测残差相关的多项 式,如式(3)所示; Obj ≈ ∑m i=1 [l(y t i , yˆi (t−1) + ft(xi))] ≈ ∑m i=1 [l(y t i , yˆi (t−1))+ ft(xi)gi + 1 2 (ft 2 (xi)hi)]+ Ω(ft) (3) l(y t i , yˆi (t−1) + ft(xi)) y t i yˆi (t−1) ft(xi) gi hi 其中, 是 f(x) 对应的损失函数,其 中 表示第 t 棵树的真实标签, 是第 t−1 步模 型给出的预测值, 是第 t 棵树的模型; 和 分 别是损失函数的一阶和二阶导数. (3)基于目标函数,采取某种手段将树的结构 优化,最终转变为的结构分数如式(4)所示: Obj = − 1 2 ∑ T j=1 G 2 j Hj +λ +γT (4) γ λ Gj Hj 其中, 和 为提前设定的超参数;T 表示叶子数 量; 和 由损失函数和特定结构下树的预测结 果共同决定;结构分数 Obj 越小表示树越优化. (4)树的结构确定后,借助贪心算法来实现树 的分裂并求取算法模型的局部最优解[15] . 1.3 随机森林 为验证 XGBoost 算法的高精度与高效率,基 于先前研究成果[16] ,本文选取了预测准确率较高 的随机森林算法进行对比. 随机森林是集成学习并行模式中的一种十分 典型的机器学习算法. 该算法以单独的决策树作 为弱学习器,且弱学习器间互不依赖,其原理是将 Bagging 袋装集成作为理论基础,在对决策树进行 独立训练时利用随机种子来进行抉择[17] . 针对袋 装法,由于集成结果依赖于少数服从多数及平均 值准则,所以独立决策树的预测正确与否直接决 定了随机森林算法预测准确性的高低. 随机森林模型搭建的基本思路如下:①从数 据集中有放回的随机抽取 b 个样本[18] ;②随机选 取 a 个特征并利用这些特征对所选取的样本进行 决策树的构建;③将步骤①和②重复 z 次生成 z 棵 决策树,组合形成随机森林;④利用随机森林中的 z 棵树对新数据进行判断,最后投票确认所属类别. 2 边坡稳定性预测模型 2.1 样本数据集数据分析 收集整理数据集是建立机器学习预测模型的 第一步. 在实际工程领域中,对于一个具体的问题, 使用网络公开的一些合理且具有代表性的数据集, 其预测结果更具有说服力. 因此,本文收集了 168 个坡度剖面的数据集,该数据集由文献 [19−23] 中 的不同论文汇编而成,并已广泛用于边坡稳定性 预测,其统计特征如图 1 所示. 其中,N 代表边坡 样本的总数量,Mean 和 Std 分别代表着每一个特 征的均值和标准差,Min 和 Max 为对应特征的最 小值和最大值,Med 为特征的中位数. 2.2 预测模型建立流程 (1)数据预处理. 数据的质量影响着机器学习 模型的性能,决定了算法所能达到的模型上限[24] . 分析图 1 可知,原始数据集的孔隙水压力因子存 在异常值,因此,应将该样本进行删除清理,最终 保留 167 条数据. 又因原始数据为连续型变量,存 在数据尺度、量纲不统一等问题. 对此本文使用 归一化处理的手段对数据进行转换,并将处理完 毕的数据应用于算法,来提高模型算法的准确度. (2)建模因子的初步确定及筛选. 本文收集的 数据集中包含了对边坡稳定性影响最大的一些参 数:几何形状、重力、地质力学参数和土壤中的水 量. 对这些参数进行分析,初步确定了边坡高度、 边坡角、孔隙压力比、容重、内聚力和内摩擦角 6 个建模因子后,借助方差过滤手段来删除方差值 为 0 且对样本区分没有价值的特征. 然后再使用 卡方检验、F 检验以及互信息法 3 种相关性检验 的方法对建模因子进行筛选. (3)PCA 降维. 为了对比不同特征工程手段对 于预测模型准确率的影响,本文还采用 PCA 降维 算法对特征进行处理,创造具有不可读性的全新 特征. 此外,考虑到保留特征过多达不到降维效 果,以及留下特征较少,新特征向量无法容纳初始 数据的大部分信息等弊端,本文借助累积可解释 方差贡献率曲线及最大似然估计自动选取降维参 数 n_components 的最佳取值,并基于此查看模型 · 182 · 工程科学学报,第 44 卷,第 2 期
武梦婷等:基于机器学习的边坡安全稳定性评价及防护措施 183 100 (a) 40 ☐Stable slope (b) 35 50 L(c) Stable slope ☐Unstable slope ☐Unstable slope 168 30 =168 80 04.19 40 =68 =133.08 =102+ e76 60 320 -16 15 020 30 10 10 今8分s 6 Slope height/m Slope angle/() Pore-pressure ratio 50 35 (d) ☐Stable slope 120 (e) Stable sloo (f)☐Stableslope Unstable slope Unstable slope 30 Unstable slope 40 100 =168 =2176 Mean=34.12 25 =168 873 Sd4.15 S1d45.96 Min12 80 兰 S-10.61 20 M=0 60 00 20 Md=19.96 15 0 10 10 30 5 0 0 0 141618202224262830 0 50100150200250300 81216202428323640 Unit weight/(kN-m) Cohesion/kPa Internal friction angle/() 图1影响因素的特征统计.(a)坡高分布:(b)坡角分布:(c)孔隙压力比分布:(d)容重分布:(e)内聚力分布:(f)内摩擦角分布 Fig.1 Characteristic statistics of influencing factors:(a)distribution of slope height;(b)slope angle distribution;(c)pore pressure ratio distribution. (d)unit weight distribution;(e)distribution of cohesion;(f)interal friction angle distribution 预测准确率.下文将详细介绍PCA技术的研究成果 精确度,又被称为查准率,其分母为所有被判 (4)模型的初步建立及调参.本文首先将数据 断为正例的样本,而分子是真正的正例样本,召回 集中的167个样本按照3:7的比例随机划分产生 率,又叫作查全率、敏感度,其含义是在所有真实 测试集与训练集.然后在完整数据集上,利用筛选 为正例1的样本中,被预测为1的样本的占比.计 后的建模因子作为输入指标,同时采用随机森林 算定义如式(6)和(7)所示: 以及XGBoost两种学习算法搭建边坡安全稳定性 TP Precision (6) 评估模型.并使用10折交叉验证作为上述两种分 TP+FP TP 类器的评估指标,在不断增加弱学习器数量的基 Recall =TP+FN (7) 础上通过改变超参数来提升模型的分类效果 ROC是一条以假正率(FPR)为横坐标,Recall 2.3模型评估 为纵坐标的受试者工作特征曲线.曲线下方围成的 最佳超参数组合确定后,本文将调参完毕的 面积由AUC表示,其有效评价范围一般为[0.5,1]. 两种分类算法重新使用原始训练集进行训练并用 面积越大代表ROC曲线越陡,则模型性能越优良 测试集进行评估,选取了基于混淆矩阵的4个评 当AUC的值超过0.9时,代表该模型的预测非常 估指标:准确率(Accuracy)、查准率(Precision)、召 准确:而当其低于0.5时,便不再具有判断价值 回率(Recall)以及接受者操作特性曲线(ROC) 和该曲线下围成的面积(AUC,Area under curve), 3结果分析 对模型性能进行衡量 3.1PCA结果分析 其中,混淆矩阵可将真实类别与预测类别的 以降维后保留的特征个数作为横坐标,新特 误分及比重情况进行可视化,并将样例分为真、 征矩阵捕捉到的累积可解释方差贡献率作为纵坐 假、正、反例4种情况,分别用TP、FP、TN及FN 标,绘制曲线如图2所示.分析可知,降维后的最 表示.而准确率是指在全部样本中被预测正确的 佳维度范围处于3,4]之间,其所占的信息量占原 样本所占的比例,其取值越接近1代表预测效果 始数据总信息量的84%左右.特征减少一半的同 越好.如公式(5)所示: 时保留的信息量仍超过80%,在某种程度上证明 TP+TN 了PCA算法的可取性.继续缩小范围绘制细化的 Accuarcy (5) TP+FN+FP+TN 学习曲线,如图3所示,结合最大似然估计法可确
预测准确率. 下文将详细介绍 PCA 技术的研究成果. (4)模型的初步建立及调参. 本文首先将数据 集中的 167 个样本按照 3∶7 的比例随机划分产生 测试集与训练集. 然后在完整数据集上,利用筛选 后的建模因子作为输入指标,同时采用随机森林 以及 XGBoost 两种学习算法搭建边坡安全稳定性 评估模型. 并使用 10 折交叉验证作为上述两种分 类器的评估指标,在不断增加弱学习器数量的基 础上通过改变超参数来提升模型的分类效果. 2.3 模型评估 最佳超参数组合确定后,本文将调参完毕的 两种分类算法重新使用原始训练集进行训练并用 测试集进行评估,选取了基于混淆矩阵的 4 个评 估指标:准确率(Accuracy)、查准率(Precision)、召 回率(Recall) [25] 以及接受者操作特性曲线(ROC) 和该曲线下围成的面积(AUC,Area under curve) , 对模型性能进行衡量. 其中,混淆矩阵可将真实类别与预测类别的 误分及比重情况进行可视化,并将样例分为真、 假、正、反例 4 种情况,分别用 TP、FP、TN 及 FN 表示. 而准确率是指在全部样本中被预测正确的 样本所占的比例,其取值越接近 1 代表预测效果 越好. 如公式(5)所示: Accuarcy = TP+TN TP+FN+FP+TN (5) 精确度,又被称为查准率,其分母为所有被判 断为正例的样本,而分子是真正的正例样本. 召回 率,又叫作查全率、敏感度,其含义是在所有真实 为正例 1 的样本中,被预测为 1 的样本的占比. 计 算定义如式(6)和(7)所示: Precision = TP TP+FP (6) Recall = TP TP+FN (7) ROC 是一条以假正率(FPR)为横坐标, Recall 为纵坐标的受试者工作特征曲线. 曲线下方围成的 面积由 AUC 表示,其有效评价范围一般为 [0.5,1]. 面积越大代表 ROC 曲线越陡,则模型性能越优良. 当 AUC 的值超过 0.9 时,代表该模型的预测非常 准确;而当其低于 0.5 时,便不再具有判断价值. 3 结果分析 3.1 PCA 结果分析 以降维后保留的特征个数作为横坐标,新特 征矩阵捕捉到的累积可解释方差贡献率作为纵坐 标,绘制曲线如图 2 所示. 分析可知,降维后的最 佳维度范围处于 [3,4] 之间,其所占的信息量占原 始数据总信息量的 84% 左右. 特征减少一半的同 时保留的信息量仍超过 80%,在某种程度上证明 了 PCA 算法的可取性. 继续缩小范围绘制细化的 学习曲线,如图 3 所示,结合最大似然估计法可确 100 80 60 Numbers Numbers Numbers Numbers Numbers Numbers 40 20 Slope height/m Slope angle/(°) Pore-pressure ratio Unit weight/(kN·m−3) Cohesion/kPa Internal friction angle/(°) 0 (a) (d) (e) (f) (b) (c) 40 35 30 25 20 15 10 5 0 40 50 30 20 10 0 40 50 30 20 10 0 120 100 80 60 40 20 0 35 30 25 20 15 10 5 0 50 100 150 200 250 300 350 400 450 500 20 25 30 35 40 45 50 55 60 14 16 18 20 22 24 26 28 30 0 50 100 150 200 250 300 8 12 16 20 24 28 32 36 40 0 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 45 N=168 Mean=104.19 Std=133.08 Min=3.6 Max=511 Med=50 N=168 Mean=36.10 Std=10.25 Min=16 Max=59 Med=35 N=168 Mean=0.48 Std=3.46 Min=0 Max=45 Med=0.25 N=168 Mean=21.76 Std=4.15 Min=12 Max=31.3 Med=20.96 N=168 Mean=34.12 Std=45.96 Min=0 Max=300 Med=19.96 N=168 Mean=28.73 Std=10.61 Min=0 Max=45 Med=30.24 Stable slope Unstable slope Stable slope Unstable slope Stable slope Unstable slope Stable slope Unstable slope Stable slope Unstable slope Stable slope Unstable slope 图 1 影响因素的特征统计. (a)坡高分布;(b)坡角分布;(c)孔隙压力比分布;(d)容重分布;(e)内聚力分布;(f)内摩擦角分布 Fig.1 Characteristic statistics of influencing factors: (a) distribution of slope height; (b) slope angle distribution; (c) pore pressure ratio distribution; (d) unit weight distribution; (e) distribution of cohesion; (f) internal friction angle distribution 武梦婷等: 基于机器学习的边坡安全稳定性评价及防护措施 · 183 ·
184 工程科学学报,第44卷,第2期 定降维最佳维度为3,此时随机森林分类模型的预 而初步建立的两个预测模型在训练集上都表现较 测准确率达到87.46%,XGBoost分类模型的预测 为优秀,其预测准确率随着样本的增加逐渐接近 准确率达到88.68%.但使用原始数据集构建两种 100%.但在验证集上却表现相对不佳.因此,本文 模型的预测准确率分别为92.90%和91.14%,由此 通过参数调整来提高模型的泛化能力, 可见使用PCA降维后的模型预测效果有所下降 针对两个分类模型,基于学习曲线能预测弱 此外,基于6个特征对运算速度影响较小的考虑, 学习器数量n estimators的变化趋势,并且具有判 PCA算法不适用于最终模型的构建 断该参数是否能一直推动模型预测准确率上升的 优势.本文借助学习曲线初步划定范围,并在确定 1.0 好的范围内,将其进一步细化,以此来对超参数 0.9 n estimators进行优化.并在弱学习器数量确定后 0.8 将泛化误差作为出发点,借助网格搜索以及偏差- poure dxa 0.7 方差图对随机森林模型的最大深度max depth、分 0.6 枝时所需考虑的特征数max_features以及生成森 0.5 林的随机种子树random state参数进行调整,从而 0.4 提升模型的复杂度.最终确定随机森林分类算法 1 2 3 4 5 Number of components after dimension reduction 的最佳参数组合为[random_state':4,n_estimators': 图2累积可解释方差贡献率曲线 35,'max_depth':8,'max_features':3]. Fig.2 Cumulative explanatory variance contribution curve 与此同时,本文使用学习率参数learning_rate 3.2 模型参数调整及评估结果分析 来干涉XGBoost树模型的迭代步长并进行剪枝调 如图4所示,训练集上的表现展示了模型的学 参,通过调整损失函数下降的最小gamma值及最 习能力,测试集上的表现展示了模型的泛化性能 大深度max depth参数来增强模型的泛化能力,最 0.875 (a) 0.89(b) 0.870 0.88 0.865 0.87 月0860 0.86 0.855 0.850 0.85 0.845 0.84 2.0 2.5 3.0 3.5 4.0 2.0 2.5 3.0 3.5 4.0 Number of components after dimension reduction Number of components after dimension reduction 图3降维后的模型表现.(a)随机森林模型:(b)XGBoost模型 Fig.3 Model performance after dimensionality reduction:(a)random forest model;(b)XGBoost model 1.00F 1.00 [(b) 0.95 (a) 0.95 0.90 0.90 0.75 0.70 0.75 量Training 0.70 Training 0.65 ◆Testing -Testing 20 406080100120140 20406080100120140 The number of samples The number of samples 图4训练集和验证集的结果对比.(a)随机森林模型:(b)XGBoost模型 Fig.4 Comparison of the results between the training set and the verification set:(a)random forest model;(b)XGBoost model
定降维最佳维度为 3,此时随机森林分类模型的预 测准确率达到 87.46%,XGBoost 分类模型的预测 准确率达到 88.68%. 但使用原始数据集构建两种 模型的预测准确率分别为 92.90% 和 91.14%,由此 可见使用 PCA 降维后的模型预测效果有所下降. 此外,基于 6 个特征对运算速度影响较小的考虑, PCA 算法不适用于最终模型的构建. 1.0 0.9 0.8 0.7 0.6 0.5 0.4 1 2 3 4 5 6 Number of components after dimension reduction Cumulative explained variance ratio 图 2 累积可解释方差贡献率曲线 Fig.2 Cumulative explanatory variance contribution curve 3.2 模型参数调整及评估结果分析 如图 4 所示,训练集上的表现展示了模型的学 习能力,测试集上的表现展示了模型的泛化性能. 而初步建立的两个预测模型在训练集上都表现较 为优秀,其预测准确率随着样本的增加逐渐接近 100%,但在验证集上却表现相对不佳. 因此,本文 通过参数调整来提高模型的泛化能力. 针对两个分类模型,基于学习曲线能预测弱 学习器数量 n_estimators 的变化趋势,并且具有判 断该参数是否能一直推动模型预测准确率上升的 优势. 本文借助学习曲线初步划定范围,并在确定 好的范围内,将其进一步细化,以此来对超参数 n_estimators 进行优化. 并在弱学习器数量确定后 将泛化误差作为出发点,借助网格搜索以及偏差− 方差图对随机森林模型的最大深度 max_depth、分 枝时所需考虑的特征数 max_features 以及生成森 林的随机种子树 random_state 参数进行调整,从而 提升模型的复杂度. 最终确定随机森林分类算法 的最佳参数组合为[‘random_state’:4,‘n_estimators’: 35,‘max_depth’:8,‘max_features’:3]. 与此同时,本文使用学习率参数 learning_rate 来干涉 XGBoost 树模型的迭代步长并进行剪枝调 参,通过调整损失函数下降的最小 gamma 值及最 大深度 max_depth 参数来增强模型的泛化能力,最 Number of components after dimension reduction 2.0 2.5 3.0 3.5 4.0 Number of components after dimension reduction 2.0 2.5 3.0 3.5 4.0 0.875 (a) (b) 0.870 0.865 0.860 Score Score 0.855 0.850 0.845 0.89 0.88 0.87 0.86 0.85 0.84 图 3 降维后的模型表现. (a)随机森林模型;(b)XGBoost 模型 Fig.3 Model performance after dimensionality reduction: (a) random forest model; (b) XGBoost model 1.00 0.95 (a) 0.90 0.85 0.80 Accuarcy 0.75 0.70 0.65 The number of samples 20 40 60 80 100 120 140 Training Testing (b) 1.00 0.95 0.90 0.85 Accuarcy 0.80 0.75 0.70 The number of samples 20 40 60 80 100 120 140 Training Testing 图 4 训练集和验证集的结果对比. (a)随机森林模型;(b)XGBoost 模型 Fig.4 Comparison of the results between the training set and the verification set: (a) random forest model; (b) XGBoost model · 184 · 工程科学学报,第 44 卷,第 2 期
武梦婷等:基于机器学习的边坡安全稳定性评价及防护措施 185· 终确定了XGBoost分类算法的最佳参数组合为 此外,鉴于数据集划分时的随机性,为保证评 ['n_estimators':77,'learning_rate':0.95,'gamma': 估结果的合理准确,本文利用准确率、查准率、召 0.3,‘max depth':5l 回率以及AUC4个评估指标进行了10次均值求 将确定最佳参数的两个算法模型分别用70% 解并加以对比分析,如表1所示.通过不断调整ROC 的数据训练完毕后应用于测试集进行测试,10次 阈值,确定了当该参数分别为0.5867以及0.3186 预测结果表现如图5所示.分析可知,XGBoost模 时,两种分类模型的综合评估结果最佳,最终的 型表现相对较好,其平均准确率达到了92%,而随 ROC曲线如图6所示 机森林的预测平均值为86% 分析表1可知,XGBoost算法所得各项值都略 高于其他项,说明XGBoost分类算法在数据集上 0.98 表现效果较好,其平均准确率达到92%、精确度达 0.96 。-Random forest XGBoost 到91.0%、查准率达到96%以及AUC可达到0.95. 0.94 0.92 因此XGBoost确定为本边坡数据集的最佳预测 0.90 模型 0.86 表1两种算法评估结果差异表 0.84 Table 1 Different evaluation results obtained from the two algorithms 0.82 Indicators Random forest XGBoost 0.80 6 10 Accuracy 0.86 0.92 Times to repeat Precision 0.90 0.91 图5测试集的10次预测准确率 Recall 0.85 0.96 Fig.5 Ten times prediction accuracy of the test set using random forest AUC 0.92 0.95 and XGBoost models 1.0 (a) 1.0b) 0.8 0.8 0.6 0.4 0.4 0.2 0.2 —AUC=0.92 AUC=0.95 0.2 0.40.6 0.8 1.0 0.2 0.40.6 0.8 1.0 False positive rate False positive rate 因6调整后的ROC与AUC展示.(a)随机森林模型:(b)XGBoost模型 Fig.6 ROC and AUC display after adjustment:(a)random forest model;(b)XGBoost mode 3.3影响因素权重分析 关联性越强;F值是用来表示拟合方程显著性的两 3.3.1相关性检验 个均方的比值(效应项/误差项),F越大,拟合程度 本文基于地形地貌、地质条件、水的作用以及 越好. 人为干扰4个要素对于边坡安全稳定的影响分 对表2进行分析可知,在卡方检验及F检验的 析,采用卡方检验、F检验以及互信息法3种特征 结果中,坡高、容重还有内摩擦角这三个评价因子 工程手段来评判特征与标签之间的相关性,并将 的卡方值x2与F值较高.其中,通过卡方计算,得 结果通过卡方值X2、P值、F值以及互信息量估计 出容重与内摩擦角两个因子的P值结果均大于临 值4个统计变量进行呈现.其中,x表示观察值与 界值0.05,说明该评价因子与标签无明显的线性 理论值之间的吻合程度,P值为结果可信水平的一 关系,但基于上述影响因素分析可知,其对边坡的 个递减指标,通常被认为P=0.05是样本变量关联 安全稳定仍具有某种干扰.同样地,F检验中,这 可接收过错的边界;X越大P值越小,两个变量的 3个评价因子的P值都小于临界值,且容重的P值
终确定了 XGBoost 分类算法的最佳参数组合为 [‘n_estimators’:77,‘learning_rate’:0.95,‘gamma’: 0.3,‘max_depth’:5]. 将确定最佳参数的两个算法模型分别用 70% 的数据训练完毕后应用于测试集进行测试,10 次 预测结果表现如图 5 所示. 分析可知,XGBoost 模 型表现相对较好,其平均准确率达到了 92%,而随 机森林的预测平均值为 86%. Accuarcy Times to repeat Random forest XGBoost 0 2 4 6 8 10 0.98 0.96 0.94 0.92 0.90 0.88 0.86 0.84 0.82 0.80 图 5 测试集的 10 次预测准确率 Fig.5 Ten times prediction accuracy of the test set using random forest and XGBoost models 此外,鉴于数据集划分时的随机性,为保证评 估结果的合理准确,本文利用准确率、查准率、召 回率以及 AUC 4 个评估指标进行了 10 次均值求 解并加以对比分析,如表 1 所示. 通过不断调整 ROC 阈值,确定了当该参数分别为 0.5867 以及 0.3186 时,两种分类模型的综合评估结果最佳,最终的 ROC 曲线如图 6 所示. 分析表 1 可知,XGBoost 算法所得各项值都略 高于其他项,说明 XGBoost 分类算法在数据集上 表现效果较好,其平均准确率达到 92%、精确度达 到 91.0%、查准率达到 96% 以及 AUC 可达到 0.95. 因此 XGBoost 确定为本边坡数据集的最佳预测 模型. 3.3 影响因素权重分析 3.3.1 相关性检验 χ 2 χ 2 χ 2 本文基于地形地貌、地质条件、水的作用以及 人为干扰 4 个要素对于边坡安全稳定的影响分 析,采用卡方检验、F 检验以及互信息法 3 种特征 工程手段来评判特征与标签之间的相关性,并将 结果通过卡方值 、P 值、F 值以及互信息量估计 值 4 个统计变量进行呈现. 其中, 表示观察值与 理论值之间的吻合程度,P 值为结果可信水平的一 个递减指标,通常被认为 P=0.05 是样本变量关联 可接收过错的边界; 越大 P 值越小,两个变量的 关联性越强;F 值是用来表示拟合方程显著性的两 个均方的比值(效应项/误差项),F 越大,拟合程度 越好. χ 2 对表 2 进行分析可知,在卡方检验及 F 检验的 结果中,坡高、容重还有内摩擦角这三个评价因子 的卡方值 与 F 值较高. 其中,通过卡方计算,得 出容重与内摩擦角两个因子的 P 值结果均大于临 界值 0.05,说明该评价因子与标签无明显的线性 关系,但基于上述影响因素分析可知,其对边坡的 安全稳定仍具有某种干扰. 同样地,F 检验中,这 3 个评价因子的 P 值都小于临界值,且容重的 P 值 表 1 两种算法评估结果差异表 Table 1 Different evaluation results obtained from the two algorithms Indicators Random forest XGBoost Accuracy 0.86 0.92 Precision 0.90 0.91 Recall 0.85 0.96 AUC 0.92 0.95 1.0 (a) 0.8 0.6 Recall 0.4 0.2 0 False positive rate 0 0.2 0.4 0.6 0.8 AUC=0.92 1.0 1.0 (b) 0.8 0.6 Recall 0.4 0.2 0 AUC=0.95 False positive rate 0 0.2 0.4 0.6 0.8 1.0 图 6 调整后的 ROC 与 AUC 展示. (a)随机森林模型;(b)XGBoost 模型 Fig.6 ROC and AUC display after adjustment: (a) random forest model; (b) XGBoost model 武梦婷等: 基于机器学习的边坡安全稳定性评价及防护措施 · 185 ·
·186 工程科学学报,第44卷,第2期 结果为0,说明此时容重的P位于拒绝域,从而证 于0,表示全部特征都和标签之间满足线性相关, 明了该特征与标签有很强的相关性,对边坡的安 从而说明了内聚力对于边坡的稳定状态也有一定 全稳定干扰性最强.此外,互信息法的评估值都大 的影响 表2三种特征选择方法下的评价因子重要性 Table 2 Importance of evaluation factors under the three feature selection methods Important evaluation factors and corresponding index scores Feature selection method Slope height Unit weight Internal friction angle Chi-square(x)test 2=6.9396P=0.0084 X2=3.5136P=0.0609 X2=2.5307P=0.1117 Ftest F=22.5560P=0.00000441 F=49.7141P=0 F=34.8498P=0.00000002 Mutual information method 0.2354 0.2173 0.2791(Cohesion) 综上所述,在特征工程中,容重、坡高、内摩 利于特征筛选并提高模型鲁棒性的特有属性.此 擦角以及内聚力4个评价因子对边坡稳定性影响 外,针对边坡是否处于稳定状态的评估问题,特 最大 征重要性也可以从侧面反映各因素对边坡稳定 3.3.2评价因子重要性分析 的影响程度,从而为边坡安全防护方案的制定提 随机森林和XGBoost分类算法都具有计算特 供有效参考.将重复10次计算所得的各评价因 征重要程度并将其进行输出的功能.其中,特征 子对预测模型的重要性进行可视化展示,如图7 重要性(feature importance)是一种在某种程度上 所示 Unit weight 0.283 Unit weight 0.319 Cohesion 0.215 Slope height 0.166 Slope height -0.16 Cohesion 0.159 Intemal friction angle 0.132 Pore pressure ratio 40.129 Slope angle 0.108 Slope angle 0.113 Pore pressure ratio +0.097 (a) Intemal friction angle +0.112 (b) 0.1 0.2 0.3 0.4 0.1 0.2 0.3 0.4 0.5 Mean decrease in impurity Mean decrease in impurity 图7特征重要性排序.(a)随机森林模型:(b)XGBoost模型 Fig.7 Rank of feature importance:(a)Random forest model;(b)XGBoost model 其中,横坐标为各评价因子的权重系数,纵坐 3.4.1注浆支护与锚注加固 标为6个特征的英文表示.分析图7可知,容重、 土质边坡内应力超过其剪切极限值时,部分 内聚力和坡高3个评价因子在随机森林与XGBoost 土体会出现相对滑动,进而导致边坡变形破坏.而 算法模型中的重要程度最高 内摩擦角是岩土体内部的抗剪强度指标之一,其 结合3.3.1相关性检验可知,容重、坡高、内摩 取决于摩擦强度和内聚力,而内聚力又决定着土 擦角以及内聚力被证明是导致边坡失稳破坏的重 体的抗剪能力,内聚力越大,其抵抗变形的抗剪强 要参数,可尝试作为边坡防治的着手点进行分析 度及刚度也会随之增强,边坡的存在状态也会更 研究. 加安全稳定2,注浆是一种有效提升内聚力的方 3.4边坡安全防护 式,通过喷注浆液生成全新的高强度胶体,并借 边坡安全防护的本质就是预防边坡的变形、 助物化反应,可提高界面的剪切强度和抗剪刚 防止发生失稳破坏.针对实际边坡工程,可考虑从 度可.此外,在注浆完成后额外增加坡面防护,不 本文研究的数据集入手,以容重、坡高、内摩擦角 仅能对岩体软弱面进行直接调整,还可避免单独 以及内聚力4个内在参数作为重点考虑对象,结 使用锚杆所带来的问题,使边坡由内至外的整体 合先进技术手段以及工程社会效应来制定经济合 稳定性得以大幅提高21,因此,锚注加固方法应加 理的防护方案,不失为一种科学、理想的措施 以重视
结果为 0,说明此时容重的 P 位于拒绝域,从而证 明了该特征与标签有很强的相关性,对边坡的安 全稳定干扰性最强. 此外,互信息法的评估值都大 于 0,表示全部特征都和标签之间满足线性相关, 从而说明了内聚力对于边坡的稳定状态也有一定 的影响. 表 2 三种特征选择方法下的评价因子重要性 Table 2 Importance of evaluation factors under the three feature selection methods Feature selection method Important evaluation factors and corresponding index scores Slope height Unit weight Internal friction angle χ 2 Chi-square ( ) test χ 2=6.9396 P=0.0084 χ 2=3.5136 P= 0.0609 χ 2=2.5307 P =0.1117 F test F =22.5560 P =0.00000441 F=49.7141 P=0 F =34.8498 P=0.00000002 Mutual information method 0.2354 0.2173 0.2791 (Cohesion) 综上所述,在特征工程中,容重、坡高、内摩 擦角以及内聚力 4 个评价因子对边坡稳定性影响 最大. 3.3.2 评价因子重要性分析 随机森林和 XGBoost 分类算法都具有计算特 征重要程度并将其进行输出的功能. 其中,特征 重要性( feature_importance)是一种在某种程度上 利于特征筛选并提高模型鲁棒性的特有属性. 此 外,针对边坡是否处于稳定状态的评估问题,特 征重要性也可以从侧面反映各因素对边坡稳定 的影响程度,从而为边坡安全防护方案的制定提 供有效参考. 将重复 10 次计算所得的各评价因 子对预测模型的重要性进行可视化展示,如图 7 所示. Unit weight Cohesion Slope height Internal friction angle Slope angle Pore pressure ratio Unit weight Slope height Cohesion Pore pressure ratio Slope angle Internal friction angle Feature Feature Mean decrease in impurity 0 0.1 0.2 0.3 0.4 Mean decrease in impurity 0 0.1 0.2 0.3 0.4 0.5 0.283 0.215 0.319 0.166 0.159 0.129 0.113 0.112 0.16 0.132 0.108 0.097 (a) (b) 图 7 特征重要性排序. (a)随机森林模型;(b)XGBoost 模型 Fig.7 Rank of feature importance: (a) Random forest model; (b) XGBoost model 其中,横坐标为各评价因子的权重系数,纵坐 标为 6 个特征的英文表示. 分析图 7 可知,容重、 内聚力和坡高 3 个评价因子在随机森林与 XGBoost 算法模型中的重要程度最高. 结合 3.3.1 相关性检验可知,容重、坡高、内摩 擦角以及内聚力被证明是导致边坡失稳破坏的重 要参数,可尝试作为边坡防治的着手点进行分析 研究. 3.4 边坡安全防护 边坡安全防护的本质就是预防边坡的变形、 防止发生失稳破坏. 针对实际边坡工程,可考虑从 本文研究的数据集入手,以容重、坡高、内摩擦角 以及内聚力 4 个内在参数作为重点考虑对象,结 合先进技术手段以及工程社会效应来制定经济合 理的防护方案,不失为一种科学、理想的措施. 3.4.1 注浆支护与锚注加固 土质边坡内应力超过其剪切极限值时,部分 土体会出现相对滑动,进而导致边坡变形破坏. 而 内摩擦角是岩土体内部的抗剪强度指标之一,其 取决于摩擦强度和内聚力,而内聚力又决定着土 体的抗剪能力,内聚力越大,其抵抗变形的抗剪强 度及刚度也会随之增强,边坡的存在状态也会更 加安全稳定[26] . 注浆是一种有效提升内聚力的方 式,通过喷注浆液生成全新的高强度胶体, 并借 助物化反应,可提高界面的剪切强度和抗剪刚 度[27] . 此外,在注浆完成后额外增加坡面防护,不 仅能对岩体软弱面进行直接调整,还可避免单独 使用锚杆所带来的问题,使边坡由内至外的整体 稳定性得以大幅提高[28] ,因此,锚注加固方法应加 以重视. · 186 · 工程科学学报,第 44 卷,第 2 期
武梦婷等:基于机器学习的边坡安全稳定性评价及防护措施 ·187 3.4.2有效疏排水 理,可以在保留80%信息的前提下将输入变量维 地表水及地下水的渗人会造成岩土体含水量 度从六维降至三维,但模型预测效果有所下降,从 增加,进而使得孔隙水压力不断上升29,土的容重 而判定PCA算法不适用于最终模型的构建 增加,内聚力及抗剪强度下降.采取有效的疏排水 (2)采用随机森林和XGBo0st两种学习算法 措施,可提高岩土体的内聚力与内摩擦角,降低孔 构建边坡安全稳定性评价模型,将其评价结果对 隙水压力及容重值,进而提升边坡安全系数,使边 比分析可得XGBoost模型的评估效果较好,预测 坡的稳定状态得以改善 准确率的平均值为92%,精确度为91.0%、查准率 边坡疏排水分为地表排水和地下排水两种. 达到96%以及AUC可达到0.95.因此XGBoost确 地表排水对各类边坡工程皆为适用,能够改善因 定为本边坡数据集的最佳预测模型 地表水作用导致的边坡稳定性降低.一般在坍、 (3)本文采取卡方检验、F检验以及互信息法 滑体上方,按其汇水面积及降雨情况,结合地形设 3种相关性检验手段,对评价因子进行分析处理, 置一道或几道截水沟,使地表水全部汇入截水沟, 并通过将两种分类算法下的评价因子的重要程度 引至路基边沟或涵洞排出.地下排水的整体方案 加以分析计算及可视化展示,明确了容重、坡高、 应根据边坡所处位置、边坡与建筑物关系、工程 内摩擦角以及内聚力4个内在因素对于模型构建 地质和水文地质条件确定,可选用渗沟、盲沟、排 的重要性,以及对边坡稳定存在的影响力 水洞、排水孔及集水井等形式.坍、滑体内地下水 (4)边坡安全防护工作可重点考虑容重、坡 丰富且层次较多时,可设支撑盲沟,用于排水和支 高、内摩擦角以及内聚力4种因素的影响,以此作 撑.当坍、滑体上方有地下水时,在垂直于地下水 为切入点并结合工程实际制定具体防护措施 流的方向设截水盲沟,将地下水引向两侧排出 3.4.3植被护坡 参考文献 采用植被防护,就是利用植被对边坡的覆盖 [1]Thai Pham B,Tien Bui D,Prakash I.Landslide susceptibility 作用、植物根系对边坡的加固作用,保护路基边坡 modelling using different advanced decision trees methods.Ci 免受大气降水与地表径流的冲刷,植被防护的手 Eng Emviron Syst,2018,35(1-4):139 [2] Balogun A L,Rezaie F,Pham Q B,et al.Spatial prediction of 段通常为种草、铺草皮和植树 landslide susceptibility in western Serbia using hybrid support 植被不仅能使坡面保持适宜湿度,防止岩土体 vector regression (SVR)with GWO,BAT and COA algorithms. 含水量过高,其根系还具有高抗拉性、较大变形率 Geo.sci Front,2021,12(3:101104 及能将土壤和草根抗剪强度无形融合的固结能 [3] Peethambaran B,Anbalagan R,Kanungo D P,et al.A comparative 力,因此将其植入土中与工程材料结合使用,可有 evaluation of supervised machine learning algorithms for township 效控制土体变形并改善内聚力,使土体抗剪强度 level landslide susceptibility zonation in parts of Indian Himalayas 提升,增强边坡的安全稳定性) CATENA,2020,195:104751 [4] Samui P.Slope stability analysis:A support vector machine 3.4.4减载 approach.Environ Geol,2008,56(2):255 坡度较高的边坡力学条件特殊,破碎岩土体 [5] Jiang S H,Liu Y,Zhang H L,et al.Quantitatively evaluating the 较多,容易在外界作用力的影响下发生崩坡、滑 effects of prior probability distribution and likelihood function 坡.而岩层间的大量裂隙又使得其渗透能力增强, models on slope reliability assessment.Rock Soil Mech,2020 雨季天气时水压的增大使得侵蚀严重,更易发生 41(9:3087 失稳事故 (蒋水华,刘源,章浩龙,等.先验概率分布及似然函数模型的选 择对边坡可靠度评价影响的定量评估.岩土力学,2020,41(9): 因此,对于超出限定范围的高耸边坡,可采取 3087) 削头减载与削坡减载两种手段.削头减载通过将 [6] Neuland H.A prediction model of landslips.CATENA,1976, 边坡岩土体上部削减来实现降低边坡的总高度; 3(2):215 而削坡减载在保持阻滑体不被破坏的情况下,尽 [7]Pradhan B.Lee S.Landslide susceptibility assessment and factor 量将处于不安全状态的岩土体分剖面进行削减, effect analysis:Backpropagation artificial neural networks and 从而提高边坡的稳定性 their comparison with frequency ratio and bivariate logistic regression modelling.Environ Model Software,2010,25(6):747 4结论 [8]Alavi A H,Gandomi A H.A robust data mining approach for formulation of geotechnical engineering systems.Eng Compul, (1)借助PCA降维手段对本文数据集进行处 2011,28(3):242
3.4.2 有效疏排水 地表水及地下水的渗入会造成岩土体含水量 增加,进而使得孔隙水压力不断上升[29] ,土的容重 增加,内聚力及抗剪强度下降. 采取有效的疏排水 措施,可提高岩土体的内聚力与内摩擦角,降低孔 隙水压力及容重值,进而提升边坡安全系数,使边 坡的稳定状态得以改善. 边坡疏排水分为地表排水和地下排水两种. 地表排水对各类边坡工程皆为适用,能够改善因 地表水作用导致的边坡稳定性降低. 一般在坍、 滑体上方,按其汇水面积及降雨情况,结合地形设 置一道或几道截水沟,使地表水全部汇入截水沟, 引至路基边沟或涵洞排出. 地下排水的整体方案 应根据边坡所处位置、边坡与建筑物关系、工程 地质和水文地质条件确定,可选用渗沟、盲沟、排 水洞、排水孔及集水井等形式. 坍、滑体内地下水 丰富且层次较多时,可设支撑盲沟,用于排水和支 撑. 当坍、滑体上方有地下水时,在垂直于地下水 流的方向设截水盲沟,将地下水引向两侧排出. 3.4.3 植被护坡 采用植被防护,就是利用植被对边坡的覆盖 作用、植物根系对边坡的加固作用,保护路基边坡 免受大气降水与地表径流的冲刷. 植被防护的手 段通常为种草、铺草皮和植树. 植被不仅能使坡面保持适宜湿度,防止岩土体 含水量过高,其根系还具有高抗拉性、较大变形率 及能将土壤和草根抗剪强度无形融合的固结能 力,因此将其植入土中与工程材料结合使用, 可有 效控制土体变形并改善内聚力,使土体抗剪强度 提升,增强边坡的安全稳定性[27] . 3.4.4 减载 坡度较高的边坡力学条件特殊,破碎岩土体 较多,容易在外界作用力的影响下发生崩坡、滑 坡. 而岩层间的大量裂隙又使得其渗透能力增强, 雨季天气时水压的增大使得侵蚀严重,更易发生 失稳事故. 因此,对于超出限定范围的高耸边坡,可采取 削头减载与削坡减载两种手段. 削头减载通过将 边坡岩土体上部削减来实现降低边坡的总高度; 而削坡减载在保持阻滑体不被破坏的情况下,尽 量将处于不安全状态的岩土体分剖面进行削减, 从而提高边坡的稳定性. 4 结论 (1)借助 PCA 降维手段对本文数据集进行处 理,可以在保留 80% 信息的前提下将输入变量维 度从六维降至三维,但模型预测效果有所下降,从 而判定 PCA 算法不适用于最终模型的构建. (2)采用随机森林和 XGBoost 两种学习算法 构建边坡安全稳定性评价模型,将其评价结果对 比分析可得 XGBoost 模型的评估效果较好,预测 准确率的平均值为 92%,精确度为 91.0%、查准率 达到 96% 以及 AUC 可达到 0.95. 因此 XGBoost 确 定为本边坡数据集的最佳预测模型. (3)本文采取卡方检验、F 检验以及互信息法 3 种相关性检验手段,对评价因子进行分析处理, 并通过将两种分类算法下的评价因子的重要程度 加以分析计算及可视化展示,明确了容重、坡高、 内摩擦角以及内聚力 4 个内在因素对于模型构建 的重要性,以及对边坡稳定存在的影响力. (4)边坡安全防护工作可重点考虑容重、坡 高、内摩擦角以及内聚力 4 种因素的影响,以此作 为切入点并结合工程实际制定具体防护措施. 参 考 文 献 Thai Pham B, Tien Bui D, Prakash I. Landslide susceptibility modelling using different advanced decision trees methods. Civ Eng Environ Syst, 2018, 35(1-4): 139 [1] Balogun A L, Rezaie F, Pham Q B, et al. Spatial prediction of landslide susceptibility in western Serbia using hybrid support vector regression (SVR) with GWO, BAT and COA algorithms. Geosci Front, 2021, 12(3): 101104 [2] Peethambaran B, Anbalagan R, Kanungo D P, et al. A comparative evaluation of supervised machine learning algorithms for township level landslide susceptibility zonation in parts of Indian Himalayas. CATENA, 2020, 195: 104751 [3] Samui P. Slope stability analysis: A support vector machine approach. Environ Geol, 2008, 56(2): 255 [4] Jiang S H, Liu Y, Zhang H L, et al. Quantitatively evaluating the effects of prior probability distribution and likelihood function models on slope reliability assessment. Rock Soil Mech, 2020, 41(9): 3087 (蒋水华, 刘源, 章浩龙, 等. 先验概率分布及似然函数模型的选 择对边坡可靠度评价影响的定量评估. 岩土力学, 2020, 41(9): 3087) [5] Neuland H. A prediction model of landslips. CATENA, 1976, 3(2): 215 [6] Pradhan B, Lee S. Landslide susceptibility assessment and factor effect analysis: Backpropagation artificial neural networks and their comparison with frequency ratio and bivariate logistic regression modelling. Environ Model Software, 2010, 25(6): 747 [7] Alavi A H, Gandomi A H. A robust data mining approach for formulation of geotechnical engineering systems. Eng Comput, 2011, 28(3): 242 [8] 武梦婷等: 基于机器学习的边坡安全稳定性评价及防护措施 · 187 ·
188 工程科学学报,第44卷.第2期 [9]Martins FF,Miranda T F S.Application of data mining techniques under data mining /Proceedings of the Workshop on Biennial to the safety evaluation of slopes /Information Technology in International Conference on Engineering.Honolulu,2010:765 Geo-Engineering:Proceedings of the 1st International Conference [20]Lu P,Rosenbaum M S.Artificial neural networks and grey (/CITG).Shanghai,2010:84 systems for the prediction of slope stability.Nat Haards,2003. [10]Zhao H B.Reliability analysis of slope based on support vector 30(3):383 machine.Chin J Georech Eng,2007,29(6):819 [21]Sah N K,Sheorey P R,Upadhyaya L N.Maximum likelihood (赵洪波.基于支持向量机的边坡可靠性分析.岩土工程学报 estimation of slope stability.Int J Rock Mech Min Sci Geomech 2007,29(6):819) Abstr,1994,31(1):47 [11]Chen S P.Genetic Algorithm and Program Design for Reliability [22]Yan X M,Li X B.Bayes discriminant analysis method for Analysis of Soil Slope Stability [Dissertation].Changsha:Central predicting the stability of open pit slope /2011 International South University,2008 Conference on Electric Technology and Civil Engineering (陈善攀.土质边坡稳定可靠度分析遗传算法方法及程序设计 (/CETCE).Lushan,2011:147 [学位论文].长沙:中南大学,2008) [23]Zhou K P,Chen ZQ.Stability prediction of tailing dam slope [12]Gou QQ,Zhao M S,Chi E A,et al.Prediction and application of based on neural network patter recognition /2009 Second evaluation factors in blasting vibration based on PCA-BP neural International Conference on Environmental and Computer network.Min Res Dev,2018,38(12):97 Science.Dubai,2009:380 (苟倩侍,赵明生,池恩安,等.基于PCA-BP神经网络在爆破振 [24]Fan Q.Rapid Evaluation Method Research of Rock Slope Stability 动评价要素中的预测及应用.矿业研究与开发,2018,38(12): 97) for Highway Based on Machine Learning Process [Dissertation] [13]Lin H M,Du Z F.Some problems in comprehensive evaluation in Chengdu:Chengdu University of Technology,2019 (樊奇.基于机器学习全流程的高速公路岩质边坡稳定性快速 the principal component analysis.Stat Res,2013,30(8):25 (林海明,杜子芳.主成分分析综合评价应该注意的问题.统计 评价方法研究学位论文].成都:成都理工大学,2019) 研究,2013,30(8):25) [25]Wu S,Liu L,Lu D.Imbalanced data ensemble classification based [14]Chen G F,Lu Y F,Cheng S G.Principal component analysis of on cluster-based under-sampling algorithm.ChinJ Eng,2017, influence factors of slope stability.Met Mine,2008(4):123 39(8):1244 (陈高峰,卢应发,程圣国.边坡稳定性影响因素主成分分析.金 (武森,刘露,卢丹.基于聚类欠采样的集成不均衡数据分类算 属矿山,2008(4):123) 法.工程科学学报,2017,39(8):1244) [15]Mao Y K.Stability Evaluation of Landslide Based on Machine [26]Luo S L,Wan W,Tang J Z,et al.Numerical study of factors Learning and System Development [Dissertation].Chengdu: influencing slope stability.Miner Eng Res,2016,31(4):37 University of Electronic Science and Technology of China,2020 (罗世林,万文,唐劲舟,等.影响边坡稳定性因素数值研究.矿 (毛宇昆.基于机器学习的滑坡稳定性评价及系统研发[学位论 业工程研究,2016,31(4):37) 文].成都:电子科技大学,2020) [27]Xiao D S.Quantitative theory of slope shear strength increased by [16]Qi CC.Tang X L.Slope stability prediction using integrated vegetation.Sichuan Archit,2004,24(1)上:63 metaheuristic and machine learning approaches:A comparative (肖东升.植被增加边坡抗剪强度的量化理论.四川建筑,2004, study.Comput Ind Eng,2018,118:112 24(1):63) [17]Zhang Y F,Lu Z Q.Remaining useful life prediction based on an [28]Xu W Z,Peng Z B,Yuan H P.Characteristic analysis of bolting integrated neural network.ChinJ Eng,2020,42(10):1372 grouting reinforcement in jointed and fractured slope.Hydrogeol (张永峰,陆志强.基于集成神经网络的剩余寿命预测.工程科 Eng Geol,.2006,33(5):30 学学报,2020,42(10):1372) (许万忠,彭振斌,袁海平.节理裂隙边坡锚注加固机制及特性 [18]Cong M,Wu T.Liu D,et al.Prostate MR/TRUS image 研究.水文地质工程地质,2006,33(5):30) segmentation and registration methods based on supervised [29]Zheng K H,Luo Z Q,Luo C Y,et al.Layered gravel soil slope learning.Chin J Eng,2020,42(10):1362 stability of a waste dump considering long-term hard rain.ChinJ (丛明,吴童,刘冬,等.基于监督学习的前列腺MR/TRUS图像分 Eg,2016,38(9:1204 割和配准方法.工程科学学报,2020,42(10):1362) (郑开欢,罗周全,罗成彦,等.持续暴雨作用下排土场层状碎石 [19]Li J H,Wang F.Study on the forecasting models of slope stability 土边坡稳定性.工程科学学报,2016,38(9):1204)
Martins F F, Miranda T F S. Application of data mining techniques to the safety evaluation of slopes // Information Technology in Geo-Engineering: Proceedings of the 1st International Conference (ICITG). Shanghai, 2010: 84 [9] Zhao H B. Reliability analysis of slope based on support vector machine. Chin J Geotech Eng, 2007, 29(6): 819 (赵洪波. 基于支持向量机的边坡可靠性分析. 岩土工程学报, 2007, 29(6):819) [10] Chen S P. Genetic Algorithm and Program Design for Reliability Analysis of Soil Slope Stability [Dissertation]. Changsha: Central South University, 2008 ( 陈善攀. 土质边坡稳定可靠度分析遗传算法方法及程序设计 [学位论文]. 长沙: 中南大学, 2008) [11] Gou Q Q, Zhao M S, Chi E A, et al. Prediction and application of evaluation factors in blasting vibration based on PCA-BP neural network. Min Res Dev, 2018, 38(12): 97 (苟倩倩, 赵明生, 池恩安, 等. 基于PCA-BP神经网络在爆破振 动评价要素中的预测及应用. 矿业研究与开发, 2018, 38(12): 97) [12] Lin H M, Du Z F. Some problems in comprehensive evaluation in the principal component analysis. Stat Res, 2013, 30(8): 25 (林海明, 杜子芳. 主成分分析综合评价应该注意的问题. 统计 研究, 2013, 30(8):25) [13] Chen G F, Lu Y F, Cheng S G. Principal component analysis of influence factors of slope stability. Met Mine, 2008(4): 123 (陈高峰, 卢应发, 程圣国. 边坡稳定性影响因素主成分分析. 金 属矿山, 2008(4):123) [14] Mao Y K. Stability Evaluation of Landslide Based on Machine Learning and System Development [Dissertation]. Chengdu: University of Electronic Science and Technology of China, 2020 ( 毛宇昆. 基于机器学习的滑坡稳定性评价及系统研发[学位论 文]. 成都: 电子科技大学, 2020) [15] Qi C C, Tang X L. Slope stability prediction using integrated metaheuristic and machine learning approaches: A comparative study. Comput Ind Eng, 2018, 118: 112 [16] Zhang Y F, Lu Z Q. Remaining useful life prediction based on an integrated neural network. Chin J Eng, 2020, 42(10): 1372 (张永峰, 陆志强. 基于集成神经网络的剩余寿命预测. 工程科 学学报, 2020, 42(10):1372) [17] Cong M, Wu T, Liu D, et al. Prostate MR/TRUS image segmentation and registration methods based on supervised learning. Chin J Eng, 2020, 42(10): 1362 (丛明, 吴童, 刘冬, 等. 基于监督学习的前列腺MR/TRUS图像分 割和配准方法. 工程科学学报, 2020, 42(10):1362) [18] [19] Li J H, Wang F. Study on the forecasting models of slope stability under data mining // Proceedings of the Workshop on Biennial International Conference on Engineering. Honolulu, 2010: 765 Lu P, Rosenbaum M S. Artificial neural networks and grey systems for the prediction of slope stability. Nat Hazards, 2003, 30(3): 383 [20] Sah N K, Sheorey P R, Upadhyaya L N. Maximum likelihood estimation of slope stability. Int J Rock Mech Min Sci Geomech Abstr, 1994, 31(1): 47 [21] Yan X M, Li X B. Bayes discriminant analysis method for predicting the stability of open pit slope // 2011 International Conference on Electric Technology and Civil Engineering (ICETCE). Lushan, 2011: 147 [22] Zhou K P, Chen Z Q. Stability prediction of tailing dam slope based on neural network pattern recognition // 2009 Second International Conference on Environmental and Computer Science. Dubai, 2009: 380 [23] Fan Q. Rapid Evaluation Method Research of Rock Slope Stability for Highway Based on Machine Learning Process [Dissertation]. Chengdu: Chengdu University of Technology, 2019 ( 樊奇. 基于机器学习全流程的高速公路岩质边坡稳定性快速 评价方法研究[学位论文]. 成都: 成都理工大学, 2019) [24] Wu S, Liu L, Lu D. Imbalanced data ensemble classification based on cluster-based under-sampling algorithm. Chin J Eng, 2017, 39(8): 1244 (武森, 刘露, 卢丹. 基于聚类欠采样的集成不均衡数据分类算 法. 工程科学学报, 2017, 39(8):1244) [25] Luo S L, Wan W, Tang J Z, et al. Numerical study of factors influencing slope stability. Miner Eng Res, 2016, 31(4): 37 (罗世林, 万文, 唐劲舟, 等. 影响边坡稳定性因素数值研究. 矿 业工程研究, 2016, 31(4):37) [26] Xiao D S. Quantitative theory of slope shear strength increased by vegetation. Sichuan Archit, 2004, 24(1): 63 (肖东升. 植被增加边坡抗剪强度的量化理论. 四川建筑, 2004, 24(1):63) [27] Xu W Z, Peng Z B, Yuan H P. Characteristic analysis of bolting grouting reinforcement in jointed and fractured slope. Hydrogeol Eng Geol, 2006, 33(5): 30 (许万忠, 彭振斌, 袁海平. 节理裂隙边坡锚注加固机制及特性 研究. 水文地质工程地质, 2006, 33(5):30) [28] Zheng K H, Luo Z Q, Luo C Y, et al. Layered gravel soil slope stability of a waste dump considering long-term hard rain. Chin J Eng, 2016, 38(9): 1204 (郑开欢, 罗周全, 罗成彦, 等. 持续暴雨作用下排土场层状碎石 土边坡稳定性. 工程科学学报, 2016, 38(9):1204) [29] · 188 · 工程科学学报,第 44 卷,第 2 期