章结构数据库 页码,1/10 第三章结构数据库 【前介】 本章将集中介绍生物信息学中生物分子结构的有关内容,并将研究重点放在三维结构实际存 在的氨基酸序列上,力图使读者了解结构数据库记录的内容及如何合理应用各类通用软件程 序处理这类记录。本章不涉及结构生物学家们建立三维分子结构的计算程序,也不讨论相似 蛋白质构象的精细结构。在本章参考书目后列出了一些优秀的讨论蛋白质构象的有关专著和 蛋白质结构决定方法。 用图象直观表示蛋白质和核酸结构在生物化学教科书和硏究论文中屡屡出现。这些图象是美 丽迷人的反而使我们忽视了图象背后所反映的实验细节���实验中应用的生物物理 方法,X射线晶体衍射学家和核磁共振波谱分析学家们努力工作的成效.在结构数据库中记录 的数据是实用化的实验数据。它既不同于直接由仪器获得的原始数据,也并非原始数据的简 单数学转换。每一个结构数据库记录都内含着随结构预测技术的进步而不断变化的假设和偏 好。尽管如此,每个生物分子结构蕴涵着有关序列所缺失数据的至关重要的信息。 ·三维分子结构数据的一些概念 首先做一个关于如何记录生物高聚物的三维数据的思想实验。考虑一下如何在纸上记录如肌 球素这类蛋白质的三维球棒模型的所有细节和尺度关系。一条开始的途径是从由三维模型主 干描绘出的氨基酸序列入手。从N端开始,我们通过将每个残基的化学结构与20种普通氨基 酸化学结构(其结构的图解可以从教科书中找到)比较,以识别每个氨基酸侧链。 旦序列被写出来,我们将绘制生物高聚物的二维草图,草图中包括所有的原子、基本符 号、化学键,可能会占用几页纸。亚化血红素配合基的绘制即为一例。将它的化学结构画在 纸上后,我们可以通过量测模型中每个原子在设定的直角坐标系中的距离记录三维数据。同 时也提供了球�棒结构中每个原子“球”的x,y,z坐标距离数据。 下一步是提出一个系统的分门别类的记录方案以保存与识别有关的每个原子的(x,y,z)坐 标信息。最简单的方法是在生物高聚物的二维草图上,每个原子的右侧,标出(x,y,z)三 元坐标值。 以上思想实验有助于我们对三维结构数据库应包含哪些内容形成初步的概念。从人类可读性 的角度而言,这样的结构记录形式是足够的,但计算机却不一定能够理解它。计算机需要原 子、化学键、坐标、残基、分子间结合关系的清晰明显的编码。 坐标、序列、化学图像 典型的三维结构记录中与使用的文件格式无关的最明显的数据是坐标数据,它表征了分子中 原子的空间位置,用沿着每个坐标轴到某特定原点的距离(x,y,z)表示。每个原子的坐标 数据归属于结构记录中的标注信息列表:空间中的每一点代表了记录中的元素、残基和分 子。对于生物多聚体,这标注信息来源于序列。每个序列固含的是重要的化学数据。我们能 够直接从序列中推断出完整的包含所有原子和化学键的生物高聚物分子化学联接,能够恰如 早先所描述的仅从序列信息出发描绘出草图。我们把这分子“草图”称作三维结构的化学图 像。序列是生物高聚物分子完整化学图谱的固有表示。 当描绘从属原子与化学键的略图以表示序列时,我们可以借鉴教科书中描绘的每个残基的化 学结构,以免露掉一两个甲基。同样地,计算机可利用“残基词典”在内存中建立结构的类 似于略图的化学图像表示,“残基词典”中则包括一组对应于每个普通氨基酸或核酸模块的 原子类型与化学键信息表。 file://E:wcb生物信息学(中译本)\第三章结构数据库.htm 2005-1-18ϝゴ㒧ᵘ᭄ᑧ Ǐࠡҟǐ ᴀゴᇚ䲚Ёҟ㒡⫳⠽ֵᙃᄺЁ⫳⠽ߚᄤ㒧ᵘⱘ᳝݇ݙᆍˈᑊᇚⷨお䞡⚍ᬒϝ㓈㒧ᵘᅲ䰙ᄬ ⱘ⇼䝌ᑣ߫ϞˈՓ䇏㗙њ㾷㒧ᵘ᭄ᑧ䆄ᔩⱘݙᆍঞབԩড়⧚ᑨ⫼㉏䗮⫼䕃ӊ ᑣ໘⧚䖭㉏䆄ᔩDŽᴀゴϡ⍝ঞ㒧ᵘ⫳⠽ᄺᆊӀᓎゟϝ㓈ߚᄤ㒧ᵘⱘ䅵ㅫᑣˈгϡ䅼䆎ⳌԐ 㲟ⱑ䋼ᵘ䈵ⱘ㊒㒚㒧ᵘDŽᴀゴখ㗗кⳂৢ߫ߎњϔѯӬ⾔ⱘ䅼䆎㲟ⱑ䋼ᵘ䈵ⱘ᳝݇ϧ㨫 㲟ⱑ䋼㒧ᵘއᅮᮍ⊩DŽ ⫼䈵Ⳉ㾖㸼⼎㲟ⱑ䋼Ḍ䝌㒧ᵘ⫳⠽࣪ᄺᬭ⾥кⷨお䆎᭛Ёስስߎ⦃DŽ䖭ѯ䈵ᰃ㕢 Б䗋Ҏⱘড㗠Փ៥Ӏᗑ㾚њ䈵㚠ৢ᠔ডⱘᅲ偠㒚㡖���ᅲ偠Ёᑨ⫼ⱘ⫳⠽⠽⧚ ᮍ⊩ˈ;ᇘ㒓ԧ㸡ᇘᄺᆊḌ⺕݅ᤃ⊶䈅ߚᵤᄺᆊӀࡾᎹⱘ៤ᬜ㒧ᵘ᭄ᑧЁ䆄ᔩ ⱘ᭄ᰃᅲ⫼࣪ⱘᅲ偠᭄DŽᅗ᮶ϡৠѢⳈ⬅Ҿ఼㦋ᕫⱘॳྟ᭄ˈгᑊ䴲ॳྟ᭄ⱘㅔ ऩ᭄ᄺ䕀ᤶDŽ↣ϔϾ㒧ᵘ᭄ᑧ䆄ᔩ䛑ݙⴔ䱣㒧ᵘ乘⌟ᡔᴃⱘ䖯ℹ㗠ϡᮁব࣪ⱘ؛䆒أ དDŽሑㅵབℸˈ↣Ͼ⫳⠽ߚᄤ㒧ᵘ㭈⎉ⴔ᳝݇ᑣ߫᠔㔎༅᭄ⱘ㟇݇䞡㽕ⱘֵᙃDŽ z ϝ㓈ߚᄤ㒧ᵘ᭄ⱘϔѯὖᗉ 佪خܜϔϾ݇Ѣབԩ䆄ᔩ⫳⠽催㘮⠽ⱘϝ㓈᭄ⱘᗱᛇᅲ偠DŽ㗗㰥ϔϟབԩ㒌Ϟ䆄ᔩབ㙠 ⧗㋴䖭㉏㲟ⱑ䋼ⱘϝ㓈⧗Ầൟⱘ᠔᳝㒚㡖ሎᑺ݇㋏DŽϔᴵᓔྟⱘ䗨ᕘᰃҢ⬅ϝ㓈ൟЏ ᑆᦣ㒬ߎⱘ⇼䝌ᑣܹ߫DŽҢN’ッᓔྟˈ៥Ӏ䗮䖛ᇚ↣Ͼ⅟ⱘ࣪ᄺ㒧ᵘϢ20⾡᱂䗮⇼ 䝌࣪ᄺ㒧ᵘ˄݊㒧ᵘⱘ㾷ৃҹҢᬭ⾥кЁᡒࠄ↨˅䕗ˈҹ䆚߿↣Ͼ⇼䝌ջ䫒DŽ ϔᮺᑣ߫㹿ߎݭᴹˈ៥Ӏᇚ㒬ࠊ⫳⠽催㘮⠽ⱘѠ㓈㤝ˈ㤝Ёࣙᣀ᠔᳝ⱘॳᄤǃᴀヺ োǃ࣪ᄺ䬂ˈৃ㛑Ӯऴ⫼义㒌DŽѮ࣪㸔㑶㋴䜡ড়ⱘ㒬ࠊेЎϔ՟DŽᇚᅗⱘ࣪ᄺ㒧ᵘ⬏ 㒌Ϟৢˈ៥Ӏৃҹ䗮䖛䞣⌟ൟЁ↣Ͼॳᄤ䆒ᅮⱘⳈ㾦തᷛ㋏Ёⱘ䎱⾏䆄ᔩϝ㓈᭄DŽৠ ᯊгᦤկњ⧗�Ầ㒧ᵘЁ↣ϾॳᄤĀ⧗āⱘ[ˈ\ˈ]തᷛ䎱⾏᭄DŽ ϟϔℹᰃᦤߎϔϾ㋏㒳ⱘߚ䮼߿㉏ⱘ䆄ᔩᮍḜҹֱᄬϢ䆚߿᳝݇ⱘ↣Ͼॳᄤⱘ˄[ˈ\ˈ]˅ത ֵᷛᙃDŽ᳔ㅔऩⱘᮍ⊩ᰃ⫳⠽催㘮⠽ⱘѠ㓈㤝Ϟˈ↣Ͼॳᄤⱘেջˈᷛߎ˅[ˈ\ˈ]˄ϝ ܗതᷛؐDŽ ҹϞᗱᛇᅲ偠᳝ࡽѢ៥Ӏᇍϝ㓈㒧ᵘ᭄ᑧᑨࣙાѯݙᆍᔶ៤߱ℹⱘὖᗉDŽҢҎ㉏ৃ䇏ᗻ ⱘ㾦ᑺ㗠㿔ˈ䖭ḋⱘ㒧ᵘ䆄ᔩᔶᓣᰃ䎇ⱘˈԚ䅵ㅫᴎैϡϔᅮ㛑⧚㾷ᅗDŽ䅵ㅫᴎ䳔㽕ॳ ᄤǃ࣪ᄺ䬂ǃതᷛǃ⅟ǃߚᄤ䯈㒧ড়݇㋏ⱘ⏙᱄ᯢᰒⱘ㓪ⷕDŽ z തᷛǃᑣ߫ǃ࣪ᄺڣ ൟⱘϝ㓈㒧ᵘ䆄ᔩЁϢՓ⫼ⱘ᭛ӊḐᓣ᮴݇ⱘ᳔ᯢᰒⱘ᭄ᰃത᭄ᷛˈᅗ㸼ᕕњߚᄤЁ ॳᄤⱘぎ䯈ԡ㕂ˈ⫼⊓ⴔ↣Ͼതᷛ䕈ࠄᶤ⡍ᅮॳ⚍ⱘ䎱⾏˄[ˈ\ˈ]˅㸼⼎DŽ↣Ͼॳᄤⱘതᷛ ᭄ᔦሲѢ㒧ᵘ䆄ᔩЁⱘᷛ⊼ֵᙃ߫㸼˖ぎ䯈Ёⱘ↣ϔ⚍ҷ㸼њ䆄ᔩЁⱘܗ㋴ǃ⅟ߚ ᄤDŽᇍѢ⫳⠽㘮ԧˈ䖭ᷛ⊼ֵᙃᴹ⑤Ѣᑣ߫DŽ↣Ͼᑣ߫ⱘᰃ䞡㽕ⱘ࣪ᄺ᭄DŽ៥Ӏ㛑 ⳈҢᑣ߫Ёᮁߎᅠᭈⱘࣙ᠔᳝ॳᄤ࣪ᄺ䬂ⱘ⫳⠽催㘮⠽ߚᄤ࣪ᄺ㘨ˈ㛑ᙄབ ᮽܜ᠔ᦣ䗄ⱘҙҢᑣֵ߫ᙃߎথᦣ㒬ߎ㤝DŽ៥Ӏᡞ䖭ߚᄤĀ㤝ā⿄ϝ㓈㒧ᵘⱘ࣪ᄺ ڣDŽᑣ߫ᰃ⫳⠽催㘮⠽ߚᄤᅠᭈ࣪ᄺ䈅ⱘ᳝㸼⼎DŽ ᔧᦣ㒬ҢሲॳᄤϢ࣪ᄺ䬂ⱘ⬹ҹ㸼⼎ᑣ߫ᯊˈ៥Ӏৃҹ׳䡈ᬭ⾥кЁᦣ㒬ⱘ↣Ͼ⅟ⱘ࣪ ᄺ㒧ᵘˈҹܡ䴆ᥝϔϸϾ⬆DŽৠḋഄˈ䅵ㅫᴎৃ߽⫼Ā⅟䆡āݙᄬЁᓎゟ㒧ᵘⱘ㉏ ԐѢ⬹ⱘ࣪ᄺڣ㸼⼎ˈĀ⅟䆡āЁ߭ࣙᣀϔ㒘ᇍᑨѢ↣Ͼ᱂䗮⇼䝌Ḍ䝌ഫⱘ ॳᄤ㉏ൟϢ࣪ᄺ䬂ֵᙃ㸼DŽ ϝゴ㒧ᵘ᭄ᑧ 义ⷕˈ1/10 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϝゴ㒧ᵘ᭄ᑧ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com