第三章结构数据库 页码,3/10 brookhaven国家实验室(详见本章末列表)蛋白质数据库的WW站点为三维结构数据的提交、 检索提供了大量的服务。 提交结构数据 对于那些希望向PDB提交三维结构信息的人们而言,可以经由 AutoDep服务机构按照一定 的基于网页的程序步骤实现其愿望。因为提交程序是随编写时间而不断变化的,所以在 PDB的网络站点上应该能找到最新信息。核酸结构数据保存在核酸数据库NDB中。 Biotech vali dati on sui te站点是镜像站点,提供在提交结构数据前屏蔽立体化学构象 与几何学构象不一致的PDB文件的服务。 PDB明文规定拒收依靠计算机三维建模而非实验手段获得的结构数据。而关于已被宣布 为例外结构的最新细节数据的提交需与PDB商议。容纳结构模型的单独的数据库是现成 的,可以在本书的网络站点上查询有关信息。 PDB的D编码 PDB中登记入册的结构记录拥有一个唯一的包含字母与数字的被称为PDB-1D或PDB编码的四位 字符串,可由数字0~9和大写字母A~Z组合而成。因此可能的组合方案超过了130万种,没有 按某特定顺序分配PDB-D。但蛋白质数据库PDB的索引编撰者尽量设计好的记忆方法,使结构 名称易于记忆,如早先如图3.1所示的胰岛素记录3|NS。 数据库查询、PDB文件检索与链接 PDB和它的一些镜像站点提供由每个PDB记录的所有文本信息索引的文本搜索引擎,可按一些 专门的査询项目(如提交数据、作者姓名、结构表达)检索。PDB最新的搜索引擎,3DB 本数据库,支持大量的到基于因特网三维结构服务的其它网点的链接。其中包括了一些的套 Atl as,可用于PDB记录检索,如图3.2示。3 DB Atl as也是链接有PDB结构数据第三方注解的基 维、三维浏览器,如 Kinemage( Ri chardon, Ri chardon,1992)、 Resol( Sayl e, li ner�: Whi te,1995)。图3.2b显示了蛋白质1BNR的到3DB记录 Barnase的一些链接。创建 的图像有助于调整三维结构方向,以获得观察结合位点这类确定特征的最好视角。3 DB Atlas 也与专门设计的数据库相连,这些数据库由对诸如结构进化(FSSP:Holm, Sandar, 1993)、结构相似性(DALl:Holm, Sander,19%6)和蛋白质运动( Gerstein等,1994)等 相关课题有兴趣的研究者维护。3DB可相应链接№CBl的MDB服务( Hogue等,1996),提供了 条到 Entrez( Schuler等,1996)系统(包括序列、分类、 PubMed/ MEDI CINE服务和VAST结 构相似性比较)的通路。 源自PDB结构记录的序列 PDB文件编码格式的序列是众人皆知的。因为不能确保结构的完整,PDB记录包括两个序列信 息备份:隐性序列和显性序列。两者都被用于重构生物高聚体的化学图像。 显性序列在PDB文件中以关键词 SEORES打头逐行存储。不同于其它序列数据库,PDB记录用三 字母氨基酸编码,任意选择三个字母作为名称的非标准氨基酸在许多PDB记录序列条目中可被 找到。在PDB中,一些双螺旋核酸序列条目被指定依照在条目中按从3′到5′端的顺序排列的 条链在上,从5′到3′端排列的互补链在下的方式排列。虽然这些以双螺旋形式表达的序 列对人类而言是容易理解的,但直接由计算机阅读此类从3′到5′端排列的显性序列是荒堂 的 因为三维结构可能对应有多个生物高聚物链,所以使用者必须借助PDB链识别标记方可确定需 要的序列。PDB文件 SEORES入口用一个大写字母或空格作为链识别标记,以识别条目中的每个 单独的生物高聚体链。如图3.1所示的3NS结构,在记录中便存在两种胰岛素分子。3|NS序 file://E:wcb生物信息学(中译本)\第三章结构数据库.htm 2005-1-18Brookhavenᆊᅲ偠ᅸ˄䆺㾕ᴀゴ߫㸼˅㲟ⱑ䋼᭄ᑧⱘWWWキ⚍Ўϝ㓈㒧ᵘ᭄ⱘᦤѸǃ Ẕ㋶ᦤկњ䞣ⱘ᳡ࡵDŽ z ᦤѸ㒧ᵘ᭄ ᇍѢ䙷ѯᏠᳯPDBᦤѸϝ㓈㒧ᵘֵᙃⱘҎӀ㗠㿔ˈৃҹ㒣⬅AutoDep᳡ࡵᴎᵘᣝ✻ϔᅮ ⱘѢ㔥义ⱘᑣℹ偸ᅲ⦄݊ᜓᳯDŽЎᦤѸᑣᰃ䱣㓪ݭᯊ䯈㗠ϡᮁব࣪ⱘˈ᠔ҹ PDBⱘ㔥㒰キ⚍Ϟᑨ䆹㛑ᡒࠄ᳔ᮄֵᙃDŽḌ䝌㒧ᵘ᭄ֱᄬḌ䝌᭄ᑧNDBЁDŽ Biotech Validation Suiteキ⚍ᰃ䬰ڣキ⚍ˈᦤկᦤѸ㒧ᵘ᭄ࠡሣ㬑ゟԧ࣪ᄺᵘ䈵 Ϣԩᄺᵘ䈵ϡϔ㟈ⱘPDB᭛ӊⱘ᳡ࡵDŽ PDBᯢ᭛㾘ᅮᢦᬊձ䴴䅵ㅫᴎϝ㓈ᓎ㗠䴲ᅲ偠↉㦋ᕫⱘ㒧ᵘ᭄DŽ㗠݇ѢᏆ㹿ᅷᏗ Ў՟㒧ᵘⱘ᳔ᮄ㒚㡖᭄ⱘᦤѸ䳔ϢPDBଚ䆂DŽᆍ㒇㒧ᵘൟⱘऩ⣀ⱘ᭄ᑧᰃ⦄៤ ⱘˈৃҹᴀкⱘ㔥㒰キ⚍Ϟᶹ䆶ֵ᳝݇ᙃDŽ z PDBⱘID㓪ⷕ PDBЁⱏ䆄ܹݠⱘ㒧ᵘ䆄ᔩᢹ᳝ϔϾଃϔⱘࣙᄫ↡Ϣ᭄ᄫⱘ㹿⿄ЎPDB-IDPDB㓪ⷕⱘಯԡ ᄫヺІˈৃ⬅᭄ᄫ̚ݭᄫ↡$̚=㒘ড়㗠៤DŽℸৃ㛑ⱘ㒘ড়ᮍḜ䍙䖛њ130ϛ⾡ˈ≵᳝ ᣝᶤ⡍ᅮ乎ᑣߚ䜡PDB-IDDŽԚ㲟ⱑ䋼᭄ᑧPDBⱘ㋶ᓩ㓪᪄㗙ሑ䞣䆒䅵དⱘ䆄ᖚᮍ⊩ˈՓ㒧ᵘ ৡ⿄ᯧѢ䆄ᖚˈབᮽܜབ3.1᠔⼎ⱘ㛄ቯ㋴䆄ᔩ3INSDŽ z ᭄ᑧᶹ䆶ǃPDB᭛ӊẔ㋶Ϣ䫒 PDBᅗⱘϔѯ䬰ڣキ⚍ᦤկ⬅↣ϾPDB䆄ᔩⱘ᠔᳝᭛ᴀֵᙃ㋶ᓩⱘ᭛ᴀ᧰㋶ᓩ᪢ˈৃᣝϔѯ ϧ䮼ⱘᶹ䆶乍Ⳃ˄བᦤѸ᭄ǃ㗙ྦྷৡǃ㒧ᵘ㸼䖒˅Ẕ㋶DŽPDB᳔ᮄⱘ᧰㋶ᓩ᪢ˈ3DB Atlasˈৃ⫼ѢPDB䆄ᔩẔ㋶ˈབ3.2⼎DŽ3DB Atlasгᰃ䫒᳝PDB㒧ᵘ᭄ϝᮍ⊼㾷ⱘ ᴀ᭄ᑧˈᬃᣕ䞣ⱘࠄѢ⡍㔥ϝ㓈㒧ᵘ᳡ࡵⱘ݊ᅗ㔥⚍ⱘ䫒DŽ݊ЁࣙᣀњϔѯѠ 㓈ǃϝ㓈⌣㾜఼ˈབKinemage˄RichardsonˈRichardsonˈ1992˅ǃResmol˄Sayleˈ Milner�Whiteˈ1995˅DŽ3.2bᰒ⼎њ㲟ⱑ䋼1BNRⱘࠄ3DB䆄ᔩBarnaseⱘϔѯ䫒DŽ߯ᓎ ⱘڣ᳝ࡽѢ䇗ᭈϝ㓈㒧ᵘᮍˈҹ㦋ᕫ㾖ᆳ㒧ড়ԡ⚍䖭㉏⹂ᅮ⡍ᕕⱘ᳔ད㾚㾦DŽ3DB Atlas гϢϧ䮼䆒䅵ⱘ᭄ᑧⳌ䖲ˈ䖭ѯ᭄ᑧ⬅ᇍ䇌བ㒧ᵘ䖯࣪˄FSSP˖HolmˈSandarˈ 1993˅ǃ㒧ᵘⳌԐᗻ˄DALI˖HolmˈSanderˈ1996˅㲟ⱑ䋼䖤ࡼ˄Gersteinㄝˈ1994˅ㄝ Ⳍ݇䇒乬᳝݈䍷ⱘⷨお㗙㓈ᡸDŽ3DBৃⳌᑨ䫒NCBIⱘMMDB᳡ࡵ˄Hogueㄝˈ1996˅ˈᦤկњ ϔᴵࠄEntrez˄Schulerㄝˈ1996˅㋏㒳˄ࣙᣀᑣ߫ǃߚ㉏ǃPubMed/MEDICINE᳡ࡵVAST㒧 ᵘⳌԐᗻ↨䕗˅ⱘ䗮䏃DŽ z ⑤㞾PDB㒧ᵘ䆄ᔩⱘᑣ߫ PDB᭛ӊ㓪ⷕḐᓣⱘᑣ߫ᰃӫҎⱚⶹⱘDŽЎϡ㛑⹂ֱ㒧ᵘⱘᅠᭈˈPDB䆄ᔩࣙᣀϸϾᑣֵ߫ ᙃӑ˖䱤ᗻᑣ߫ᰒᗻᑣ߫DŽϸ㗙䛑㹿⫼Ѣ䞡ᵘ⫳⠽催㘮ԧⱘ࣪ᄺڣDŽ ᰒᗻᑣ߫PDB᭛ӊЁҹ݇䬂䆡SEQRESᠧ༈䗤㸠ᄬټDŽϡৠѢ݊ᅗᑣ᭄߫ᑧˈPDB䆄ᔩ⫼ϝ ᄫ↡⇼䝌㓪ⷕˈӏᛣ䗝ᢽϝϾᄫ↡Ўৡ⿄ⱘ䴲ᷛޚ⇼䝌䆌PDB䆄ᔩᑣ߫ᴵⳂЁৃ㹿 ᡒࠄDŽPDBЁˈϔѯঠ㶎ᮟḌ䝌ᑣ߫ᴵⳂ㹿ᣛᅮձ✻ᴵⳂЁᣝҢ3’ࠄ5’ッⱘ乎ᑣᥦ߫ⱘ ϔᴵ䫒ϞˈҢ5’ࠄ3’ッᥦ߫ⱘѦ㸹䫒ϟⱘᮍᓣᥦ߫DŽ㱑✊䖭ѯҹঠ㶎ᮟᔶᓣ㸼䖒ⱘᑣ ߫ᇍҎ㉏㗠㿔ᰃᆍᯧ⧚㾷ⱘˈԚⳈ⬅䅵ㅫᴎ䯙䇏ℸ㉏Ң3’ࠄ5’ッᥦ߫ⱘᰒᗻᑣ߫ᰃ㤦ූ ⱘDŽ Ўϝ㓈㒧ᵘৃ㛑ᇍᑨ᳝Ͼ⫳⠽催㘮⠽䫒ˈ᠔ҹՓ⫼㗙ᖙ乏ࡽ׳PDB䫒䆚߿ᷛ䆄ᮍৃ⹂ᅮ䳔 㽕ⱘᑣ߫DŽPDB᭛ӊSEQRESܹষ⫼ϔϾݭᄫ↡ぎḐЎ䫒䆚߿ᷛ䆄ˈҹ䆚߿ᴵⳂЁⱘ↣Ͼ ऩ⣀ⱘ⫳⠽催㘮ԧ䫒DŽབˊ᠔⼎ⱘ3INS㒧ᵘˈ䆄ᔩЁ֓ᄬϸ⾡㛄ቯ㋴ߚᄤDŽ3INSᑣ ϝゴ㒧ᵘ᭄ᑧ 义ⷕˈ3/10 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϝゴ㒧ᵘ᭄ᑧ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com