正在加载图片...
王丽莉,熊鹰,谢炜宇,牛亮亮,张朝阳 示个体最优位置,8=表示全局最优位置;c表示加速向量机建立QSPR模型预测了3609种含能材料的密 步长,c1为控制粒子飞向个体最优位置的步长,c2为控度,结果与Ammo的基团贡献法相当 制粒子飞向全局最优位置的步长,r为独立的随机函 支持向量机和支持向量回归是目前机器学习领域 数,t为代数。这种算法在精度和收敛速度上都有明显用得较多的方法,序列最小优化算法( Sequential Min- 优点,晶体结构搜索软件 CALYPSO( Crystal! tructure imal Optimization,SMO)的提出有效的解决了支持 Analysis Particle Swarm Optimization)实现了该方向量机方法实现复杂效率低等问题,特别在处理大数 法{-21,其高效可靠性经过大量系统的测试。 据量的实际问题时体现出了较好的精度和运算效率 在结构搜索领域,一些全局性参数优化方法与考可用于含能材料设计。 虑对称性的结构产生技术、判断相似结构的几何结构4.1.2人工神经网络 因子的引入、以及提高群体多样性的技术等相结合,有 人工神经网络是人工智能研究一种数学模型。1, 效的克服了前期晶体结构预测中难以保持种群多样性在解决复杂环境系统非线性关系模拟等众多问题上展 的问题,可以保证对势能面进行有效的探索。后来发示出强大的功能,越来越多的应用于炸药性能的研 展的基于高斯过程回归的机器学习势函数,将群体智宽20。K. Tatyana等运用人工智能和模式识别方 能与机器学习方法的结合,能进行大尺寸复杂材料的法,通过结构基团分析与识别,从大量已知结构数据库 结构预测切。 得到规律,对含能材料的性能进行初步预测。人工神 经网络可以正确反映配方组成和温度对装药密度的影 基于数学统计方法预测密度 响规律,对装药密度进行预测。。王国栋等结合 DFT与人工神经网络,以平均极化率、平均四极矩和偶 4.1定量构效关系模型 极矩为描述符,构建炸药密度的预测模型,预测16种 通过数学和统计学手段找出含能材料的化学结构 与密度等性质之间的量变规律,或得到构效关系的数炸药的密度与文献值相对误差为047%-6.6%。 学方程,可以为密度预测提供理论依据4-61,核心问 神经网络是一个可以自学习并能够“记忆”样本所 题是采用有效算法建立构效关系模型。本文介绍已经 含信息的理论方法,得到广泛的应用,但它也存在自身 的限制与不足,如易形成局部极小值而得不到全局最 用于含能材料密度预测模型的建立方法:回归分析、人 优解;训练次数多使得学习效率降低,收敛速率慢 工神经网络和改进的遗传算法 隐节点的选取缺乏理论指导等。针对上述问题,国内 4.1.1回归分析 回归分析是处理变量之间相关关系的常用数理统外已提出不少有效的改进方法,较常用的有增加动量 计方法,可通过后者的已知或设定值,去估计或预 项、自适应调节学习速率、引入陡度因子等 测前者的均值。在回归分析中,如果有两个或两个以 4.1.3改进的遗传算法 上的自变量,就称为多元回归。来蔚鹏等切对 遗传算法具有自组织、自适应和学习性等特点,搜 索过程以目标函数值为评价标准,不受优化函数连续 30种芳香系单质炸药的偶极矩、最高占据轨道能量 分子总能量等8个描述符进行多元线性回归计算,建性的约束。针对遗传算法收敛速度慢的缺点,程娥 立QsPR模型预测密度,训练集和测试集的预测值与 等提出一种伪并行、贪婪的、最优解保存与自适应 参数调整相结合的改进遗传算法,对标准化后的 实验值的平均误差分别为3.33%和294%。 支持向量机( Support Vector Machine,SWM)是399个炸药分子结构描述符和爆轰数据进行变量的选 择并建立定量“分子结构-爆炸性能”关系(QSDR)模 根据有限的样本信息,在模型复杂性和学习能力之间 型(式(16)),从结构描述符中筛选出13个与密度相关 寻求最佳折中,以获得良好的推广能力。支持向量回 归( Support Vector Regression,SVR)是用于解决回归性最大的参数,呋咱类化合物密度的预测值相对误差 问题的支持向量机。宗朝霞等基于遗传算法的变在±2%以内 量筛选和支持向量机预测呋咱系含能化合物的密度,y=0.3873x,-0.972x0+0.4696X0-0.0711X 0.6778x1a2+0.7236X16+0.2086X194+ 随机选取85%的待测呋咱系含能化合物作为训练集 (16) 0.2248x216-0.6644X22+0.1238X239 其余为测试集,预测结果平均相对误差分别为1.16% 0.3443X2x-0.8852X130+0.1952X38 和212%。S.N. Hwang基于多元线性回归和支持 伪并行是将群体分成N个子群,各自按照不同的 Chinese Joumal of Energetic Materials. Vol28, No 1, 2020(1-12) 含能材料 www.energetic-materials.orgcnChinese Journal of Energetic Materials,Vol.28, No.1, 2020(1-12) 含能材料 www.energetic-materials.org.cn 王丽莉,熊鹰,谢炜宇,牛亮亮,张朝阳 示个体最优位置,g best t i,j 表示全局最优位置;c 表示加速 步长,c 1 为控制粒子飞向个体最优位置的步长,c 2 为控 制粒子飞向全局最优位置的步长,r 为独立的随机函 数,t为代数。这种算法在精度和收敛速度上都有明显 优点,晶体结构搜索软件 CALYPSO(Crystal Structure Analysis Particle Swarm Optimization)实 现 了 该 方 法[71-72] ,其高效可靠性经过大量系统的测试。 在结构搜索领域,一些全局性参数优化方法与考 虑对称性的结构产生技术、判断相似结构的几何结构 因子的引入、以及提高群体多样性的技术等相结合,有 效的克服了前期晶体结构预测中难以保持种群多样性 的问题,可以保证对势能面进行有效的探索。后来发 展的基于高斯过程回归的机器学习势函数,将群体智 能与机器学习方法的结合,能进行大尺寸复杂材料的 结构预测[73] 。 4 基于数学统计方法预测密度 4.1 定量构效关系模型 通过数学和统计学手段找出含能材料的化学结构 与密度等性质之间的量变规律,或得到构效关系的数 学方程,可以为密度预测提供理论依据[74-76],核心问 题是采用有效算法建立构效关系模型。本文介绍已经 用于含能材料密度预测模型的建立方法:回归分析、人 工神经网络和改进的遗传算法。 4.1.1 回归分析 回归分析是处理变量之间相关关系的常用数理统 计方法[77],可通过后者的已知或设定值,去估计或预 测前者的均值。在回归分析中,如果有两个或两个以 上 的 自 变 量 ,就 称 为 多 元 回 归[78]。 来 蔚 鹏 等[79]对 30 种芳香系单质炸药的偶极矩、最高占据轨道能量、 分子总能量等 8 个描述符进行多元线性回归计算,建 立 QSPR 模型预测密度,训练集和测试集的预测值与 实验值的平均误差分别为 3.33% 和 2.94%。 支 持 向 量 机(Support Vector Machine,SVM)是 根据有限的样本信息,在模型复杂性和学习能力之间 寻求最佳折中,以获得良好的推广能力。支持向量回 归(Support Vector Regression,SVR)是用于解决回归 问题的支持向量机。宗朝霞等[74]基于遗传算法的变 量筛选和支持向量机预测呋咱系含能化合物的密度, 随机选取 85% 的待测呋咱系含能化合物作为训练集, 其余为测试集,预测结果平均相对误差分别为 1.16% 和 2.12%。S. N. Hwang[80] 基于多元线性回归和支持 向量机建立 QSPR 模型预测了 3609 种含能材料的密 度,结果与 Ammo 的基团贡献法相当。 支持向量机和支持向量回归是目前机器学习领域 用得较多的方法,序列最小优化算法(Sequential Min⁃ imal Optimization,SMO)的提出有效的解决了支持 向量机方法实现复杂、效率低等问题,特别在处理大数 据量的实际问题时体现出了较好的精度和运算效率, 可用于含能材料设计。 4.1.2 人工神经网络 人工神经网络是人工智能研究一种数学模型[81] , 在解决复杂环境系统非线性关系模拟等众多问题上展 示出强大的功能,越来越多的应用于炸药性能的研 究[82-84] 。K. Tatyana 等[85] 运用人工智能和模式识别方 法,通过结构基团分析与识别,从大量已知结构数据库 得到规律,对含能材料的性能进行初步预测。人工神 经网络可以正确反映配方组成和温度对装药密度的影 响规律,对装药密度进行预测[86] 。王国栋等[87-88] 结合 DFT 与人工神经网络,以平均极化率、平均四极矩和偶 极矩为描述符,构建炸药密度的预测模型,预测 16 种 炸药的密度与文献值相对误差为 0.47%~6.6%。 神经网络是一个可以自学习并能够“记忆”样本所 含信息的理论方法,得到广泛的应用,但它也存在自身 的限制与不足,如易形成局部极小值而得不到全局最 优解[89] ;训练次数多使得学习效率降低,收敛速率慢; 隐节点的选取缺乏理论指导等。针对上述问题,国内 外已提出不少有效的改进方法,较常用的有增加动量 项、自适应调节学习速率、引入陡度因子等。 4.1.3 改进的遗传算法 遗传算法具有自组织、自适应和学习性等特点,搜 索过程以目标函数值为评价标准,不受优化函数连续 性的约束。针对遗传算法收敛速度慢的缺点,程娥 等[90]提出一种伪并行、贪婪的、最优解保存与自适应 参 数 调 整 相 结 合 的 改 进 遗 传 算 法 ,对 标 准 化 后 的 399 个炸药分子结构描述符和爆轰数据进行变量的选 择并建立定量“分子结构⁃爆炸性能”关系(QSDR)模 型(式(16)),从结构描述符中筛选出 13 个与密度相关 性最大的参数,呋咱类化合物密度的预测值相对误差 在±2% 以内。 y=0.3873x 9-0.9772x 40+0.4696x 60-0.0711x 107- 0.6778x 182+0.7236x 186+0.2086x 194+ 0.2248x 216-0.6644x 223+0.1238x 239- 0.3443x 270-0.8852x 330+0.1952x 338 (16) 伪并行是将群体分成 N 个子群,各自按照不同的 6
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有