正在加载图片...
序列2(目标序列) GGVLIQVG 插入空位后 序列1(代查序列) GGVLIIQVE 序列2(目标序列) AGGVLI-QvG 图61利用插入空位的方法获得最佳序列匹配 图中竖线表示相同残基之间的匹配,插入空位前共有6个相同残基,插入空位后 共有9个相同残基 下一步,则可以计算相同残基个数,并用分数给出定量指标。如图61中未经比对以前 的得分为6,而比对后的得分为9。 显然,从这个例子中可以看出,匹配对准的相同残基数越多,两个序列之间相似性比 对的得分就越高。当然,这只是一个用来说明比对原理的简单例子,序列很短,只有10来 个残基,而大多数蛋白质序列的长度为200到500个残基,甚至更长。其次,这两个序列的 长度几乎相等,而在实际情况下代查序列和目标序列的长度往往差别很大。此外,这两个序 列的大部分残基相同,没有其它可选择的匹配方式 另一方面,序列比对结果也可以根据引入空位的数目和非匹配残基的数目来度量。由 此而引出距离矩阵的概念,即可以用距离矩阵的方式表示两个序列之间的相似性距离。序列 比对所用的距离矩阵可能不止一个,同一算法的不同实现所用的距离矩阵可能会有所不同 46子序列 为了进一步说明序列比对的基本原理,下面我们用一对比较接近实际的序列。假定序 列A有400个残基,序列B有650个残基。如果序列A与序列B的一部分相同,则可以认 为A是B的子序列。此时,只要在适当部位插入空位,就可以使序列A和序列B完全匹配 假定序列A中有两个片段分别与序列B中的两个片段相同。通过序列比对,可以找出 这些相同片段,并在序列A中插入空位,使序列A与序列B有最大的匹配,如图62(b) 所示。此时,可以找出序列A与序列B之间具有最好匹配的子序列。利用简单的渐进算法 可以直接实现上述比对,因为两个序列之间的相似片段比较明显。 47同一性和相似性 上述序列比对实例只是简要说明了如何找出两个序列之间完全相同的片段。实际操作序列 2 (目标序列) AGGVLIQVG 插入空位后 序列 1 (代查序列) AGGVLIIQVE |||||| ||| 序列 2 (目标序列) AGGVLI-QVG 图 6.1 利用插入空位的方法获得最佳序列匹配 图中竖线表示相同残基之间的匹配,插入空位前共有 6 个相同残基,插入空位后 共有 9 个相同残基 下一步,则可以计算相同残基个数,并用分数给出定量指标。如图 6.1 中未经比对以前 的得分为 6,而比对后的得分为 9。 显然,从这个例子中可以看出,匹配对准的相同残基数越多,两个序列之间相似性比 对的得分就越高。当然,这只是一个用来说明比对原理的简单例子,序列很短,只有 10 来 个残基,而大多数蛋白质序列的长度为 200 到 500 个残基,甚至更长。其次,这两个序列的 长度几乎相等,而在实际情况下代查序列和目标序列的长度往往差别很大。此外,这两个序 列的大部分残基相同,没有其它可选择的匹配方式。 另一方面,序列比对结果也可以根据引入空位的数目和非匹配残基的数目来度量。由 此而引出距离矩阵的概念,即可以用距离矩阵的方式表示两个序列之间的相似性距离。序列 比对所用的距离矩阵可能不止一个,同一算法的不同实现所用的距离矩阵可能会有所不同。 4.6 子序列 为了进一步说明序列比对的基本原理,下面我们用一对比较接近实际的序列。假定序 列 A 有 400 个残基,序列 B 有 650 个残基。如果序列 A 与序列 B 的一部分相同,则可以认 为 A 是 B 的子序列。此时,只要在适当部位插入空位,就可以使序列 A 和序列 B 完全匹配。 假定序列 A 中有两个片段分别与序列 B 中的两个片段相同。通过序列比对,可以找出 这些相同片段,并在序列 A 中插入空位,使序列 A 与序列 B 有最大的匹配,如图 6.2(b) 所示。此时,可以找出序列 A 与序列 B 之间具有最好匹配的子序列。利用简单的渐进算法, 可以直接实现上述比对,因为两个序列之间的相似片段比较明显。 4.7 同一性和相似性 上述序列比对实例只是简要说明了如何找出两个序列之间完全相同的片段。实际操作
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有