正在加载图片...
关于DNA序列分类问题的模型 冯涛康喆雯韩小军 (大连理工大学,大连116024) 指导老师贺明峰 编者按本文以统计方法提取样本特征,以之作为BP神经网络的输入,用 MATLAB中 相应算法进行训练.然后用于解决本分类问题,得到了较准确的结果.本文提取特征时考虑 较为全面,在此基础上正确地运用了神经网络方法,发挥了神经网络适用于非线性问题、具有 自适应能力的优点,思路清楚,文字简练 摘要本文提出了一种将人工神经元网络用于DNA分类的方法,作者首先应用概率 统计的方法对20个已知类别的人工DNA序列进行特征提取,形成DNA序列的特征向量,并 将之作为样本输人BP神经网络进行学习.作者应用了 MATLAB软件包中的 Neural Network Toolbox(神经网络工具箱)中的反向传播( Back propagation BP)算法来训练神经网络、在本文 中,作者构造了两个三层BP神经网络,将提取的DNA特征向量集作为样本分别输入这两个 网络进行学习,通过训练后,将20个未分类的人工序列样本和182个自然序列样本提取特征 形成特征向量并输入两个网络进行分类.结果表明:本文中提出的分类方法能够以很高的正 确率和精度对DNA序列进行分类,将人工神经元网络用于DNA序列分类是完全可行的 1问题重述(略) DNA序列由四个碱基AT、C、G按一定规律排列而成,已知所给人工序列1-10属于 A类,11-20属于B类.本题中,我们的主要工作有两个: 1)提取A、B两类特征; 2)以所提取A、B两类特征为依据,把20个人工序列及182个自然序列分为A、B两类 (可能存在同时不具有AB两类特征,不能归为A、B中任一类的序列) 在本题中,先以序列1-20为依据,提取出A、B两类序列的统计特征,然后运用神经网 络中的BP网络对未知序列进行了分类识别 2模型建立的理论依据 神经网络是近年来发展的一种大规模并行分布处理的非线性系统),其主要特点有: 1)能以任意精度逼近任意给定连续的非线性函数; 2)对复杂不确定问题具有自适应和自学习能力 3)具有较强的容错能力和信息综合能力,能同时处理定量和定性的信息,能很好地协 调多种输入信息的关系 传统的分类识别方法,对于一般非线性系统的识别很困难,而神经网络却为此提供了 个强有力的工具.它实质上是选择了一个适当的神经网络模型来通近实际系统,目前,在 神经网络中应用最多的是BP网络 对于具有n个输入节点,m个输出节点的BP网络,输入到输出的关系可以看作是 个n维欧式空间到m维欧式空间的映射,F:R”→Rm,这一映射是高度非线性映射,KT
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有