第十二章鼠类和人类公用物理图谱数据库的使用 页码,1/1 第十二章鼠类和人类公用物理图谱数据库的 使用 Li ncol n d. Stein Cold spring Harbor Laboratory Cold Spring Harbor, New York 几年前,几张已经制成的人类基因组图谱还只是在小面积上的低分辨率图。生物医学研究者 如果希望定位和克隆一个致病基因,总的说来就不得不对目的区域制图,而这是一个费时费 力的过程。这种情况在近几年发生了巨大的变化。现在已经有了高质量的人类基因组基因图 谱,它以单一序列重复多态性( Murray et al..1994: Dib et al.,1996)为基础,提供分 辨率达1-5b的图谱信息。此外,还有许多物理图谱分辨率在亚兆(sub-Mb)范围(参见 Hudson et al.1995;0′ Connell et al.,1996,及其它)。长约16000的表达序列的图谱现 在也可以得到。利用这些图,一个研究者,在很多情况下,可以只集中研究一个选定区域, 用几个小时来搜索公用图谱数据库,而不是用几个月时间做实验了 令人啼笑皆非的是,研究者的困难现在已经从基因组制图转到了使用一个巨大的未知领域。 它包括ww站点,FTP(文件传输协议 File transfer protocol)服务器和数据库。其中有大 型数据库,如 NCbI Entrez和GDB。也有小型数据库,可以提供由基因组中心发表的初级图 谱、由个体染色体委员会赞助的网址和由小型实验室使用,以发表特定区域详图的网址。每 种来源中的信息,即使与另一种中的相重复,也有其自身的价值。使用这个信息网并不容 个的潜在的相关文件。本章作为这些图谱的一个“简图”,用来引导读者穿过物理图谱数据 库的迷宫。 本章先对物理图谱制图方法作一简要回顾,然后讨论大型公用数据库 NCbI Entrez和GDB,这 些库提供了査找许多不同来源图谱的简捷途径,并能在这些来源中进行比较。接着,本章再 讨论一下由个体制图实验室所出版的资料,从在基因组范围做出制图努力的某些中心,一直 到对个体染色体做出制图努力的。因为作者的专业领域所限,本章集中讨论人类和鼠类的图 谱 物理图谱的类型 物理图谱有许多结构和形式。一个极端是限制性图谱( restriction map),用于对小区域、 如Kb量级做精细结构制图,另一个极端是细胞遗传学图( cytogenetic map),用于对以1 kb为长度量级的区域制图。但是,最常用的两种类型还是STS含量图( STS content map)和 放射性杂交图( radi ati on hybrid map),它们的分辨区域都大于1Mb,并且有能使用简易 PCR中的定位标记物的优点。 在STS含量图(图12.1)中,STS标记物通过多聚酶链反应所监测,在反应中它与一个大的插 入克隆基因库反应,如酵母人工染色体(TACs),细菌人工染色体(BACS)和粘粒等。如果 两个或多个STS被发现是存在于同一个克隆之中,那么这些标记位点紧密相邻的机会就很高 (不是100%,因为在制图过程中存在一些假象,如出现嵌合克隆体)。一段时期以来,根据 STS含量图已经建立起一系列重叠群,如含有STS的重叠簇克隆。这样一张图的分辨率和覆盖 度由一些因子决定,如STS的密度、克隆群体的大小、以及克隆文库的深度。通常STS含量图 以长1№b的插入YAC库为基础,分辨率为几百个bp。如果使用插入部分较小的克隆载体,图谱 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
कѠゴ 哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘ Փ⫼ Lincoln D. Stein Cold Spring Harbor Laboratory Cold Spring Harbor, New York ᑈࠡˈᓴᏆ㒣ࠊ៤ⱘҎ㉏㒘䈅䖬াᰃᇣ䴶⿃ϞⱘԢߚ䕼⥛DŽ⫳⠽एᄺⷨお㗙 བᵰᏠᳯᅮԡܟ䱚ϔϾ㟈⮙ˈᘏⱘ䇈ᴹህϡᕫϡᇍⳂⱘऎඳࠊˈ㗠䖭ᰃϔϾ䌍ᯊ䌍 ⱘ䖛DŽ䖭⾡ᚙމ䖥ᑈথ⫳њᎼⱘব࣪DŽ⦄Ꮖ㒣᳝њ催䋼䞣ⱘҎ㉏㒘 䈅ˈᅗҹऩϔᑣ߫䞡ᗕᗻ˄Murray et al.,1994; Dib et al., 1996˅Ў⸔ˈᦤկߚ 䕼⥛䖒ˉ5Mbⱘ䈅ֵᙃDŽℸˈ䖬᳝䆌⠽⧚䈅ߚ䕼⥛Ѯܚ˄sub-Mb˅㣗ೈ˄খ㾕 Hudson et al.,1995; O’Connell et al.,1996ˈঞ݊ᅗ˅DŽ䭓㑺16000ⱘ㸼䖒ᑣ߫ⱘ䈅⦄ гৃҹᕫࠄDŽ߽⫼䖭ѯˈϔϾⷨお㗙ˈᕜᚙމϟˈৃҹা䲚ЁⷨおϔϾ䗝ᅮऎඳˈ ⫼Ͼᇣᯊᴹ᧰㋶݀⫼䈅᭄ᑧˈ㗠ϡᰃ⫼Ͼ᳜ᯊ䯈خᅲ偠њDŽ ҸҎュⱚ䴲ⱘᰃˈⷨお㗙ⱘೄ䲒⦄Ꮖ㒣Ң㒘ࠊ䕀ࠄњՓ⫼ϔϾᎼⱘⶹ乚ඳDŽ ᅗࣙᣀwwwキ⚍ˈFTP˄᭛ӊӴ䕧ण䆂File Transfer Protocol˅᳡ࡵ఼᭄ᑧDŽ݊Ё᳝ ൟ᭄ᑧˈབNCBI EntrezGDBDŽг᳝ᇣൟ᭄ᑧˈৃҹᦤկ⬅㒘Ёᖗথ㸼ⱘ߱㑻 䈅ǃ⬅Ͼԧᶧ㡆ԧྨਬӮ䌲ࡽⱘ㔥ഔ⬅ᇣൟᅲ偠ᅸՓ⫼ˈҹথ㸼⡍ᅮऎඳ䆺ⱘ㔥ഔDŽ↣ ⾡ᴹ⑤ЁⱘֵᙃˈेՓϢϔ⾡ЁⱘⳌ䞡ˈг᳝݊㞾䑿ⱘӋؐDŽՓ⫼䖭Ͼֵᙃ㔥ᑊϡᆍ ᯧDŽ᳔䖥ˈϔ乍Alta Vist Web᧰㋶఼ϞخⱘᇍĀ㒘āϔ䆡ⱘ᧰㋶ህᡒࠄњ䍙䖛80000 Ͼⱘ┰ⱘⳌ݇᭛ӊDŽᴀゴЎ䖭ѯ䈅ⱘϔϾĀㅔāˈ⫼ᴹᓩᇐ䇏㗙こ䖛⠽⧚䈅᭄ ᑧⱘ䗋ᅿDŽ ᴀゴܜᇍ⠽⧚䈅ࠊᮍ⊩ϔㅔ㽕ಲ乒ˈ✊ৢ䅼䆎ൟ݀⫼᭄ᑧNCBI EntrezGDBˈ䖭 ѯᑧᦤկњᶹᡒ䆌ϡৠᴹ⑤䈅ⱘㅔ᥋䗨ᕘˈᑊ㛑䖭ѯᴹ⑤Ё䖯㸠↨䕗DŽⴔˈᴀゴݡ 䅼䆎ϔϟ⬅Ͼԧࠊᅲ偠ᅸ᠔ߎ⠜ⱘ䌘᭭ˈҢ㒘㣗ೈࠊߎخࡾⱘᶤѯЁᖗˈϔⳈ ࠄᇍϾԧᶧ㡆ԧࠊߎخࡾⱘDŽЎ㗙ⱘϧϮ乚ඳ᠔䰤ˈᴀゴ䲚Ё䅼䆎Ҏ㉏哴㉏ⱘ 䈅DŽ ⠽⧚䈅ⱘ㉏ൟ ⠽⧚䈅᳝䆌㒧ᵘᔶᓣDŽϔϾᵕッᰃ䰤ࠊᗻ䈅˄restriction map˅ˈ⫼Ѣᇍᇣऎඳǃ བkb䞣㑻خ㊒㒚㒧ᵘࠊˈϔϾᵕッᰃ㒚㚲䘫Ӵᄺ˄cytogenetic map˅ˈ⫼Ѣᇍҹ104 kbЎ䭓ᑺ䞣㑻ⱘऎඳࠊDŽԚᰃˈ᳔ᐌ⫼ⱘϸ⾡㉏ൟ䖬ᰃSTS䞣˄STS content map˅ ᬒᇘᗻᴖѸ˄radiation hybrid map˅ˈᅗӀⱘߚ䕼ऎඳ䛑Ѣ1MbˈᑊϨ᳝㛑Փ⫼ㅔᯧ PCRЁⱘᅮԡᷛ䆄⠽ⱘӬ⚍DŽ STS䞣˄12.1˅ЁˈSTSᷛ䆄⠽䗮䖛㘮䝊䫒ডᑨ᠔ⲥ⌟ˈডᑨЁᅗϢϔϾⱘᦦ ܹܟ䱚ᑧডᑨˈབ䝉↡ҎᎹᶧ㡆ԧ˄TACs˅ˈ㒚㦠ҎᎹᶧ㡆ԧ˄BACs˅㉬㉦ㄝDŽབᵰ ϸϾϾSTS㹿থ⦄ᰃᄬѢৠϔϾܟ䱚ПЁˈ䙷М䖭ѯᷛ䆄ԡ⚍㋻ᆚⳌ䚏ⱘᴎӮህᕜ催 ˄ϡᰃ100%ˈЎࠊ䖛Ёᄬϔѯ؛䈵ˈབߎ⦃ጠড়ܟ䱚ԧ˅DŽϔ↉ᯊᳳҹᴹˈḍ STS䞣Ꮖ㒣ᓎゟ䍋ϔ㋏߫䞡㕸ˈབ᳝STSⱘ䞡㇛ܟ䱚DŽ䖭ḋϔᓴⱘߚ䕼⥛㽚Ⲫ ᑺ⬅ϔѯᄤއᅮˈབSTSⱘᆚᑺǃܟ䱚㕸ԧⱘᇣǃҹঞܟ䱚᭛ᑧⱘ⏅ᑺDŽ䗮ᐌSTS䞣 ҹ䭓1MbⱘᦦܹYACᑧЎ⸔ˈߚ䕼⥛ЎⱒϾbpDŽབᵰՓ⫼ᦦܹ䚼ߚ䕗ᇣⱘܟ䱚䕑ԧˈ䈅 कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ1/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,2/1 就会有一个更高的理论分辨率,但是覆盖基因组同样大小面积就需要更多的STS。虽然一般有 可能从STS含量图上得到标记物的相对顺序,但是相邻标记物之间的距离还是无法精确测得。 尽管如此,STS含量图还是有与克隆原相关的优点,并且可将其用于更进一步的硏究,如次级 克隆或DNA测序。到目前为止,STS含量图制图简单而使用最多的来源是巴黎的CEPH( centre d' etudes du pol ymorphi sme Humai n)中的YAC库。它是一个10×覆盖率的文库,平均插入 长度为-Mb。 放射性杂交图(图12.2;Cox,1992)对片段DNA的断点作图。在此技术中,一个人体细胞系 被致死性的gama射线照射,染色体DNA分成片段。然后该细胞系与一个仓鼠细胞系融合而被 救,并能繁殖几代。在这期间,人类细胞和仓鼠细胞的杂合体随机丢失其人类染色体片段。 这样一百个或更多的杂合细胞系克隆体中,每一个都有不同数量的染色体片段,筛选生长 后,就可以形成一套杂合组,供接下来的制图实验用了。 如果要在一个放射性杂交组中对一个STS作图,那就要将每种杂交组细胞系中的DNA进行STS的 PCR操作。细胞系中如果含有该STS的染色体片段,那么就能得到一个正的PCR信号。在基因组 中相邻很近的STS有相似的固位模式( retenti on pattern),因为放射性引起的断点落在它 们中间的几率很小。相邻较远的STS固位模式相似性降低,相邻很远的STS的固位模式将会截 然不同。与基因图谱所用方法类似,算法类的软件也能推出STS在放射性杂交图上的相对顺 序,并通过断点落在其中间的可能性,用某一距离系统计算相邻标记物之间的距离。放射性 杂交图还能提供一个标记物位于某一个特殊位点的可能值(优势对数值)。一个放射性杂交 图的分辨率依赖于杂交体片断的大小,而这又依赖于人体细胞系所受的辐射量。一般对基因 组大小作图的细胞系分辨率为~1M。 除STS含量图和放射性杂交图外还有几个方法可用于制作人类物理图谱。克隆图谱使用与STS 含量图不同的技术来决定克隆体的接近程度。例如, CEPH YAC图谱法( Chumakoy et a 1995)综合利用指纹法( fingerprinti ng)、间一Au产物杂交法( inter-Au product hybri di zati on)和STS含量图法来制作一张重叠的YAC克隆体图谱。缺失和体细胞杂交图依赖 于大型基因组重组(可以人工引进或由实验本身引起),从而将标记物放在由染色体断点所 限定的bin?中( Vol l rath et al.,1992)。FSH图谱( Li cher et a.,1990)使用一个荧 光信号来探测克隆体的间期DNA扩散时的杂交情况,从而以细胞遗传学图中一条带的位置定出 克隆体的位置 研究者捕捉致病基因时对转录序列图谱有特别的兴趣。这些序列是由已表达序列,和那些从 已转化成STS并置于传统物理图谱的已知基因衍生而来的。近来一些制作大量EST( Adams et al.1991: Houl gatte et al.1995; Hillier et al.,1996)的工程已经使制图实验室能 够得到数以万计的单一表达序列。一旦一个致病位点被鉴定出来后,这些转录序列图谱就能 明显加快对目标基因的研究速度。 YAC库可用于STS的排序,但其克隆体中的高嵌合率和高删除率使它们不能用于DNA测序。去年 高分辨率、可用于测序的质粒和BAC图谱则发展很快。因为它们所需的克隆工艺水平很低。除 了几个特例,如染色体19的 Lawrence li vemore实验室质粒图外,其它图谱都还只处在初级阶 段 大型公用数据库中的基因组范围图谱 人类基因组物理图谱信息的主要来源是由NCB|( Nati onal Center for Bi technol ogy I nformati on国家生物技术信息中心)和GDB( Genome Data Base基因组数据基地,见注释) 提供的大型公用数据库。这些数据库提供各种图谱的来源,使研究者能够用一个多用户界面 交互系统在图谱中进行比较。在一定程度下,这些数据库还能进行图谱的综合及分析。NCB Entrez和GDB将在本节介绍。由个体中心维持的数据库可提供更为详尽的信息,并将在下一节 “从个体来源的基因组范围的图谱”中介绍 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
ህӮ᳝ϔϾ催ⱘ⧚䆎ߚ䕼⥛ˈԚᰃ㽚Ⲫ㒘ৠḋᇣ䴶⿃ህ䳔㽕ⱘSTSDŽ㱑✊ϔ㠀᳝ ৃ㛑ҢSTS䞣Ϟᕫࠄᷛ䆄⠽ⱘⳌᇍ乎ᑣˈԚᰃⳌ䚏ᷛ䆄⠽П䯈ⱘ䎱⾏䖬ᰃ᮴⊩㊒⹂⌟ᕫDŽ ሑㅵབℸˈSTS䞣䖬ᰃ᳝Ϣܟ䱚ॳⳌ݇ⱘӬ⚍ˈᑊϨৃᇚ݊⫼Ѣ䖯ϔℹⱘⷨおˈབ㑻 ܟ䱚DNA⌟ᑣDŽࠄⳂࠡЎℶˈSTS䞣ࠊㅔऩ㗠Փ⫼᳔ⱘᴹ⑤ᰃᏈ咢ⱘCEPH˄centre d’Etudes du Polymorphisme Humain˅ЁⱘYACᑧDŽᅗᰃϔϾ10×㽚Ⲫ⥛ⱘ᭛ᑧˈᑇഛᦦܹ 䭓ᑺЎ~1MbDŽ ᬒᇘᗻᴖѸ˄12.2˗Coxˈ1992˅ᇍ⠛↉DNAⱘᮁ⚍DŽℸᡔᴃЁˈϔϾҎԧ㒚㚲㋏ 㹿㟈⅏ᗻⱘgammaᇘ㒓✻ᇘˈᶧ㡆ԧDNAߚ៤⠛↉DŽ✊ৢ䆹㒚㚲㋏ϢϔϾҧ哴㒚㚲㋏㵡ড়㗠㹿 ᬥˈᑊ㛑㐕ⅪҷDŽ䖭ᳳ䯈ˈҎ㉏㒚㚲ҧ哴㒚㚲ⱘᴖড়ԧ䱣ᴎ϶༅݊Ҏ㉏ᶧ㡆ԧ⠛↉DŽ 䖭ḋϔⱒϾⱘᴖড়㒚㚲㋏ܟ䱚ԧЁˈ↣ϔϾ䛑᳝ϡৠ᭄䞣ⱘᶧ㡆ԧ⠛↉ˈㄯ䗝⫳䭓 ৢˈህৃҹᔶ៤ϔ༫ᴖড়㒘ˈկϟᴹⱘࠊᅲ偠⫼њDŽ བᵰ㽕ϔϾᬒᇘᗻᴖѸ㒘ЁᇍϔϾSTSˈ䙷ህ㽕ᇚ↣⾡ᴖѸ㒘㒚㚲㋏ЁⱘDNA䖯㸠STSⱘ PCR᪡DŽ㒚㚲㋏Ёབᵰ᳝䆹STSⱘᶧ㡆ԧ⠛↉ˈ䙷Мህ㛑ᕫࠄϔϾℷⱘPCRֵোDŽ㒘 ЁⳌ䚏ᕜ䖥ⱘSTS᳝ⳌԐⱘԡᓣ˄retention pattern˅ˈЎᬒᇘᗻᓩ䍋ⱘᮁ⚍㨑ᅗ ӀЁ䯈ⱘ⥛ᕜᇣDŽⳌ䚏䕗䖰ⱘSTSԡᓣⳌԐᗻ䰡ԢˈⳌ䚏ᕜ䖰ⱘSTSⱘԡᓣᇚӮ ✊ϡৠDŽϢ䈅᠔⫼ᮍ⊩㉏Ԑˈㅫ⊩㉏ⱘ䕃ӊг㛑ߎSTSᬒᇘᗻᴖѸϞⱘⳌᇍ乎 ᑣˈᑊ䗮䖛ᮁ⚍㨑݊Ё䯈ⱘৃ㛑ᗻˈ⫼ᶤϔ䎱⾏㋏㒳䅵ㅫⳌ䚏ᷛ䆄⠽П䯈ⱘ䎱⾏DŽᬒᇘᗻ ᴖѸ䖬㛑ᦤկϔϾᷛ䆄⠽ԡѢᶤϔϾ⡍⅞ԡ⚍ⱘৃ㛑ؐ˄Ӭᇍ᭄ؐ˅DŽϔϾᬒᇘᗻᴖѸ ⱘߚ䕼⥛ձ䌪ѢᴖѸԧ⠛ᮁⱘᇣˈ㗠䖭জձ䌪ѢҎԧ㒚㚲㋏᠔ফⱘ䕤ᇘ䞣DŽϔ㠀ᇍ 㒘ᇣⱘ㒚㚲㋏ߚ䕼⥛Ў̚1MDŽ 䰸STS䞣ᬒᇘᗻᴖѸ䖬᳝Ͼᮍ⊩ৃ⫼ѢࠊҎ㉏⠽⧚䈅DŽܟ䱚䈅Փ⫼ϢSTS 䞣ϡৠⱘᡔᴃᴹއᅮܟ䱚ԧⱘ䖥ᑺDŽ՟བˈCEPH YAC䈅⊩˄Chumakov et al., 1995˅㓐ড়߽⫼ᣛ㒍⊩˄fingerprinting˅ǃ䯈ˉAluѻ⠽ᴖѸ⊩˄inter-Alu product hybridization˅STS䞣⊩ᴹࠊϔᓴ䞡ⱘYACܟ䱚ԧ䈅DŽ㔎༅ԧ㒚㚲ᴖѸձ䌪 Ѣൟ㒘䞡㒘˄ৃҹҎᎹᓩ䖯⬅ᅲ偠ᴀ䑿ᓩ䍋˅ˈҢ㗠ᇚᷛ䆄⠽ᬒ⬅ᶧ㡆ԧᮁ⚍᠔ 䰤ᅮⱘbin?Ё˄Vollrath et al., 1992˅DŽFISH䈅˄Licher et al., 1990˅Փ⫼ϔϾ㤻 ܝֵোᴹ⌟ܟ䱚ԧⱘ䯈ᳳDNAᠽᬷᯊⱘᴖѸᚙމˈҢ㗠ҹ㒚㚲䘫ӴᄺЁϔᴵᏺⱘԡ㕂ᅮߎ ܟ䱚ԧⱘԡ㕂DŽ ⷨお㗙ᤩᤝ㟈⮙ᯊᇍ䕀ᔩᑣ߫䈅᳝⡍߿ⱘ݈䍷DŽ䖭ѯᑣ߫ᰃ⬅Ꮖ㸼䖒ᑣ߫ˈ䙷ѯҢ Ꮖ䕀࣪៤STSᑊ㕂ѢӴ㒳⠽⧚䈅ⱘᏆⶹ㸡⫳㗠ᴹⱘDŽ䖥ᴹϔѯࠊ䞣EST˄Adams et al., 1991; Houlgatte et al., 1995; Hillier et al., 1996˅ⱘᎹᏆ㒣Փࠊᅲ偠ᅸ㛑 ᕫࠄ᭄ҹϛ䅵ⱘऩϔ㸼䖒ᑣ߫DŽϔᮺϔϾ㟈⮙ԡ⚍㹿䡈ᅮߎᴹৢˈ䖭ѯ䕀ᔩᑣ߫䈅ህ㛑 ᯢᰒࡴᖿᇍⳂᷛⱘⷨお䗳ᑺDŽ YACᑧৃ⫼ѢSTSⱘᥦᑣˈԚ݊ܟ䱚ԧЁⱘ催ጠড়⥛催ߴ䰸⥛ՓᅗӀϡ㛑⫼ѢDNA⌟ᑣDŽএᑈ 催ߚ䕼⥛ǃৃ⫼Ѣ⌟ᑣⱘ䋼㉦BAC䈅߭থሩᕜᖿDŽЎᅗӀ᠔䳔ⱘܟ䱚Ꮉ㡎∈ᑇᕜԢDŽ䰸 њϾ⡍՟ˈབᶧ㡆ԧ19ⱘLawrence Livemoreᅲ偠ᅸ䋼㉦ˈ݊ᅗ䈅䛑䖬া໘߱㑻䰊 ↉DŽ ൟ݀⫼᭄ᑧЁⱘ㒘㣗ೈ䈅 Ҏ㉏㒘⠽⧚䈅ֵᙃⱘЏ㽕ᴹ⑤ᰃ⬅NCBI˄National Center for Biotechnology Informationᆊ⫳⠽ᡔᴃֵᙃЁᖗ˅GDB˄Genome Data Base㒘᭄ഄˈ㾕⊼䞞˅ ᦤկⱘൟ݀⫼᭄ᑧDŽ䖭ѯ᭄ᑧᦤկ⾡䈅ⱘᴹ⑤ˈՓⷨお㗙㛑⫼ϔϾ⫼᠋⬠䴶 ѸѦ㋏㒳䈅Ё䖯㸠↨䕗DŽϔᅮᑺϟˈ䖭ѯ᭄ᑧ䖬㛑䖯㸠䈅ⱘ㓐ড়ঞߚᵤDŽNCBI EntrezGDBᇚᴀ㡖ҟ㒡DŽ⬅ϾԧЁᖗ㓈ᣕⱘ᭄ᑧৃᦤկЎ䆺ሑⱘֵᙃˈᑊᇚϟϔ㡖 ĀҢϾԧᴹ⑤ⱘ㒘㣗ೈⱘ䈅āЁҟ㒡DŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ2/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
二章鼠类和人类公用物理图谱数据库的使用 页码,3/1 B| Entrez中染色体图谱的使用 Entrez的基因组部分是最容易获得物理图谱信息的来源之一。此服务由NCBl所提供。 Entrez 试图以一种可理解的方式将几种遗传学图谱和物理图谱、DNA和蛋白序列信息、以及一个目录 型引用数据库和三维晶体结构信息融合起来。因为它的内部连接多,而且界面简单, Entrez 可作为搜索图谱的一个起始点。 Entrez信息补救系统在第5章详细介绍 任何支持网络浏览器,如 Netscape、 Mosai c或 Mi crosoft Internet Expl orer的计算机系统都 可以使用 Entrez。与 Internet的连接应支持TCP/P,通过一个 Internet服务提供器就会形成 个有用的网络连接或是一个拨号连接。因为图谱信息中图形很多,所以应能连接28800p或 更多信息。 首先,将浏览器连到 Entrez的主页所在的URL( UNI FORM RESOURCE L0CAT0R统一资源定位 器),这样就会下载一页,包含一系列与 Entrez中核酸、蛋白质、目录、基因组和三维结构 数据库的链接,以及一些文档和帮助。选择标有“搜索基因组数据库”的链接,这样就会弹 出来一个窗口,提供搜索的范围(如图12.3)和在其它范围中一系列生物种类的名称。每 个生物体名称旁边都有一个数字,说明在数据库中其图谱的数目。得到人类图谱列表最简单 的办法就是点击标有“ Homo Sapi ens"的链接,这样就会得到一个含25个染色体图的列表 (染色体Ⅰ至Ⅹ再加上线粒体染色体组的两个词条,Y型图谱现仍没有)。 现在再在感兴趣的染色体下选择标有“图示”( Graphi cal View)的链接。这就会得到与图 12.4中所示相似的一个图谱。它是由几个图组成的一张复合图。这类图对于各个染色体来说 并不同,但至少它们都含有 Gene thon和CHLc( Cooperati ve Human Li nkage Center合作性人 类链接中心)基因图谱( Murray et al.,1994: Dib et al.,1996)、 Whi tehead I nsti tute 放射性杂交图谱和STS含量图( Hudson et al.1995)、斯坦福大学放射性杂交图谱、细胞遗 传学图、和一个序列图。序列图基本上是一个定位器,即将已制成图的片段定位。对于这些 片段,序列分析中心希望能在十年内将其制造出来。存在于多个图谱中的标记物用绿线连接 了起来,好让读者能够互相比较并在从一个图谱转向另一个时保持正确的方位。出于比较和 图示的目的,每一个图谱均由一个公用坐标系统校正,该系统以物理距离(DNA碱基对)的值 为基础。稍一检査就会发现它们只是笼统地排成一条线,如在标记物的顺序上就有很多矛 盾,在图上表现为绿线有交叉点。 这些图可以用鼠标浏览,一对标有" Action”和“Zoom”的选项按钮( radi o button)能控 制图的大小。要想对图的一部分作更详细的观察,可选择Zoom按钮,并点中需放大的区域 如果选Zoom后直接点击图上的区域,一般默认为放大10%。另外也可以用图形上方的pop-u (复选框)菜单来改变放大率的值。在高放大率下,诸如单个标记物的名称、图示基因、YAC 序列群和图示克隆等特征都可以很容易地分辨。进而也可以选择“左、右、校正”(Left Ri ght、Aign)等按钮来调整图象至合适的尺寸(左右按钮在点击Zoom一次后将会出现), Overvi ew(全览)命令将显示图象返回其初始大小。 为得到一个具体标记的图中元素的信息,可选择标有″ Action"的选项按钮,然后再点击该 元素。注意该按钮非要使用一次Zoom才会出现,例如,单击一个STS的名称将会显示其在 Genebank中的词条,而此词条又包含着与其它部分,如 Entrez词条、核酸、蛋白质和三维结 构数据库等的链接 Entrez网同时也提供了一条简单的在图上定位一个特定标记物的途径。在标有 Search ene(基因査询)的两个小框中选一个,输入标记物的名称或 Gen Bank中的通道号,然后按旁 边的按钮。这样就会产生另外一张图,其中标记物以黄色着重标记。如果输入两个名称,则 它们之间的区域将会着重显示。在此功能中,除了名称,物理图谱上很少有元素对应着实际 的基因,大多数标记物都只是重名的序列或是基因多样性中简单的序列重复(在STS中有很多 例子)。 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
NCBI EntrezЁᶧ㡆ԧ䈅ⱘՓ⫼ Entrezⱘ㒘䚼ߚᰃ᳔ᆍᯧ㦋ᕫ⠽⧚䈅ֵᙃⱘᴹ⑤ПϔDŽℸ᳡ࡵ⬅NCBI᠔ᦤկDŽEntrez 䆩ҹϔ⾡ৃ⧚㾷ⱘᮍᓣᇚ辵䘫Ӵᄺ䈅⠽⧚䈅ǃDNA㲟ⱑᑣֵ߫ᙃǃҹঞϔϾⳂᔩ ൟᓩ⫼᭄ᑧϝ㓈ԧ㒧ᵘֵᙃ㵡ড়䍋ᴹDŽЎᅗⱘݙ䚼䖲ˈ㗠Ϩ⬠䴶ㅔऩˈEntrez ৃЎ᧰㋶䈅ⱘϔϾ䍋ྟ⚍DŽEntrezֵᙃ㸹ᬥ㋏㒳ゴ䆺㒚ҟ㒡DŽ ӏԩᬃᣕ㔥㒰⌣㾜఼ˈབNetscapeǃMosaicMicrosoft Internet Explorerⱘ䅵ㅫᴎ㋏㒳䛑 ৃҹՓ⫼EntrezDŽϢInternetⱘ䖲ᑨᬃᣕTCP/IPˈ䗮䖛ϔϾInternet᳡ࡵᦤկ఼ህӮᔶ៤ ϔϾ᳝⫼ⱘ㔥㒰䖲ᰃϔϾᢼো䖲DŽЎ䈅ֵᙃЁᔶᕜˈ᠔ҹᑨ㛑䖲28800bp ֵᙃDŽ 佪ܜˈᇚ⌣㾜఼䖲ࠄEntrezⱘЏ义᠔ⱘURL˄UNIFORM RESOURCE LOCATOR㒳ϔ䌘⑤ᅮԡ ఼˅ˈ䖭ḋህӮϟ䕑ϔ义ˈࣙϔ㋏߫ϢEntrezЁḌ䝌ǃ㲟ⱑ䋼ǃⳂᔩǃ㒘ϝ㓈㒧ᵘ ᭄ᑧⱘ䫒ˈҹঞϔѯ᭛ḷᐂࡽDŽ䗝ᢽ᳝ᷛĀ᧰㋶㒘᭄ᑧāⱘ䫒ˈ䖭ḋህӮᔍ ߎᴹϔϾにষˈᦤկ᧰㋶ⱘ㣗ೈ˄བ12.3˅݊ᅗ㣗ೈЁϔ㋏߫⫳⠽⾡㉏ⱘৡ⿄DŽ↣ϔ Ͼ⫳⠽ԧৡ⿄ᮕ䖍䛑᳝ϔϾ᭄ᄫˈ䇈ᯢ᭄ᑧЁ݊䈅ⱘ᭄ⳂDŽᕫࠄҎ㉏䈅߫㸼᳔ㅔऩ ⱘࡲ⫣ህᰃ⚍ߏ”᳝ᷛHomo Sapiens”ⱘ䫒ˈ䖭ḋህӮᕫࠄϔϾ25Ͼᶧ㡆ԧⱘ߫㸼 ˄ᶧ㡆ԧĉ㟇ĒࡴݡϞ㒓㉦ԧᶧ㡆ԧ㒘ⱘϸϾ䆡ᴵˈ<ൟ䈅⦄ҡ≵᳝˅DŽ ⦄ݡ݈ᛳ䍷ⱘᶧ㡆ԧϟ䗝ᢽ᳝ᷛĀ⼎ā˄Graphical View˅ⱘ䫒DŽ䖭ህӮᕫࠄϢ 12.4Ё᠔⼎ⳌԐⱘϔϾ䈅DŽᅗᰃ⬅Ͼ㒘៤ⱘϔᓴড়DŽ䖭㉏ᇍѢϾᶧ㡆ԧᴹ䇈 ᑊϡৠˈԚ㟇ᇥᅗӀ䛑᳝GenethonCHLC˄Cooperative Human Linkage Center ড়ᗻҎ ㉏䫒Ёᖗ˅䈅˄Murray et al.,1994; Dib et al.,1996˅ǃWhitehead Institute ᬒᇘᗻᴖѸ䈅STS䞣˄Hudson et al.,1995˅ǃᮃഺ⽣ᄺᬒᇘᗻᴖѸ䈅ǃ㒚㚲䘫 ӴᄺǃϔϾᑣ߫DŽᑣ߫ᴀϞᰃϔϾᅮԡ఼ˈेᇚᏆࠊ៤ⱘ⠛↉ᅮԡDŽᇍѢ䖭ѯ ⠛↉ˈᑣ߫ߚᵤЁᖗᏠᳯ㛑कᑈݙᇚ݊ࠊ䗴ߎᴹDŽᄬѢϾ䈅Ёⱘᷛ䆄⠽⫼㓓㒓䖲 њ䍋ᴹˈད䅽䇏㗙㛑ѦⳌ↨䕗ᑊҢϔϾ䈅䕀ϔϾᯊֱᣕℷ⹂ⱘᮍԡDŽߎѢ↨䕗 ⼎ⱘⳂⱘˈ↣ϔϾ䈅ഛ⬅ϔϾ݀⫼തᷛ㋏㒳᷵ℷˈ䆹㋏㒳ҹ⠽⧚䎱⾏˄DNA⺅ᇍ˅ⱘؐ Ў⸔DŽϔẔᶹህӮথ⦄ᅗӀাᰃㄐ㒳ഄᥦ៤ϔᴵ㒓ˈབᷛ䆄⠽ⱘ乎ᑣϞህ᳝ᕜ ⳒˈϞ㸼⦄Ў㓓㒓᳝Ѹঝ⚍DŽ 䖭ѯৃҹ⫼哴ᷛ⌣㾜ˈϔᇍ᳝ᷛ“Action”“Zoom”ⱘ䗝乍ᣝ䪂˄radio button˅㛑 ࠊⱘᇣDŽ㽕ᛇᇍⱘϔ䚼ߚ䆺㒚ⱘ㾖ᆳˈৃ䗝ᢽZoomᣝ䪂ˈᑊ⚍Ё䳔ᬒⱘऎඳDŽ བᵰ䗝ZoomৢⳈ⚍ߏϞⱘऎඳˈϔ㠀咬䅸Ўᬒ10%DŽгৃҹ⫼ᔶϞᮍⱘpop-up ˄䗝Ḛ˅㦰ऩᴹᬍবᬒ⥛ⱘؐDŽ催ᬒ⥛ϟˈ䇌བऩϾᷛ䆄⠽ⱘৡ⿄ǃ⼎ǃYAC ᑣ߫㕸⼎ܟ䱚ㄝ⡍ᕕ䛑ৃҹᕜᆍᯧഄߚ䕼DŽ䖯㗠гৃҹ䗝ᢽĀᎺǃেǃ᷵ℷā˄Leftǃ RightǃAlign˅ㄝᣝ䪂ᴹ䇗ᭈ䈵㟇ড়䗖ⱘሎᇌ˄Ꮊেᣝ䪂⚍ߏZoomϔৢᇚӮߎˈ˅⦃ Overview˄ܼ㾜˅ੑҸᇚᰒ⼎䈵䖨ಲ݊߱ྟᇣDŽ ЎᕫࠄϔϾᷛԧ䆄ⱘЁܗ㋴ⱘֵᙃˈৃ䗝ᢽ᳝ᷛ“Action”ⱘ䗝乍ᣝ䪂ˈ✊ৢݡ⚍ߏ䆹 ܗ㋴DŽ⊼ᛣ䆹ᣝ䪂䴲㽕Փ⫼ϔZoomᠡӮߎˈ⦃՟བˈऩߏϔϾSTSⱘৡ⿄ᇚӮᰒ⼎݊ GenebankЁⱘ䆡ᴵˈ㗠ℸ䆡ᴵজࣙⴔϢ݊ᅗ䚼ߚˈབEntrez䆡ᴵǃḌ䝌ǃ㲟ⱑ䋼ϝ㓈㒧 ᵘ᭄ᑧㄝⱘ䫒DŽ Entrez㔥ৠᯊгᦤկњϔᴵㅔऩⱘϞᅮԡϔϾ⡍ᅮᷛ䆄⠽ⱘ䗨ᕘDŽ᳝ᷛSearch by gene˄ᶹ䆶˅ⱘϸϾᇣḚЁ䗝ϔϾˈ䕧ܹᷛ䆄⠽ⱘৡ⿄GenBankЁⱘ䗮䘧োˈ✊ৢᣝᮕ 䖍ⱘᣝ䪂DŽ䖭ḋህӮѻ⫳ϔᓴˈ݊Ёᷛ䆄⠽ҹ咘㡆ⴔ䞡ᷛ䆄DŽབᵰ䕧ܹϸϾৡ⿄ˈ߭ ᅗӀП䯈ⱘऎඳᇚӮⴔ䞡ᰒ⼎DŽℸࡳ㛑Ёˈ䰸њৡ⿄ˈ⠽⧚䈅Ϟᕜᇥ᳝ܗ㋴ᇍᑨⴔᅲ䰙 ⱘˈ᭄ᷛ䆄⠽䛑াᰃ䞡ৡⱘᑣ߫ᰃḋᗻЁㅔऩⱘᑣ߫䞡˄STSЁ᳝ᕜ ՟ᄤ˅DŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ3/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,4/1 要想将一张 Entrez 图存在用户盘上,可单击鼠标右键(或 Machi toch上的 Shi ft-Cich 建),弹出窗口上方的 Cursor,然后会产生一个pop-up菜单,选择 Save I mage As(将图形存 为)并输入一个名称作为该图形文件的文件名。该图形以GF形式保存,可以在很多图形程序 中加以显示、打印和操作。这个过程在不同的网络浏览器中略有不同,有的要求在点击图片 前选择File(文件)菜单中标有 Save next li nk to di sk(将下一个链接存盘)一项。 除人类基因组, Entrez还提供关于鼠类、果蝇、C. elegans、酵母以及一些原生动物的图谱。 尽管可比较的(同线性)图仍不可获得,但它代表了现在最大和最完整的一套多生物体的图 谱信息 尽管以网络浏览 Entrez对一般的使用已经足够,此来源使用频率高的人还是想建立一个 Entrez网站,即NCB“站柜台”,以顾客一一服务员的形式使用软件。这种形式与网络版特 征一致,但从实质上可以更好地应用,而且界面美观。它适用于 Wi ndows、 Maci tosh和Unix 等系统,并可在 Entrez overvi ew(全览)页上下载 Entrez也有一定的限制。最严重的是由几种方法构建的图谱不得不使用同一坐标系统。这种 简化,满足了将所有表示同一区域的图形同时显示的需要,但有时也掩饰了其图谱信息模棱 两可和存在矛盾的特点,制造出并不存在的确定性的假象,特别是细胞遗传学图和物理图 片、基因图谱的整合关系并不紧密,必须小心使用。当然, Entrez也和一些实验室制作的网 页相连,它们提供图谱来源,这就使图谱能够保持实验室最常用的最新的形式。这些个体中 心的图谱将在后面作更详细的介绍。 在GDB中浏览染色体图 另一种常见的人类物理图谱数据的来源是GDB。尽管GDB是基于当时基因图谱的重要性才构建 起来的,但是最近几年来,GDB也已经进行了扩建重组,现在同样可以算是物理图谱数据的仓 库。不象NCBl,GDB只限于人类图谱数据。它不含序列数据,也没有其它种类生物的信息。 同NCBI一样,GDB可以由Ww上得到。GDB提供了一种全功能的对其数据库的查询式界面,这 点,尽管很有用,对新手来说可能还是会很头疼。限制性更强的査询界面,包括一种“按址 查图”的功能,能帮助你更直接进入GDB,特别是在1996年12月引入的GDB的视图一2程序 ( Mapi ew2 program),它利用新的Java微程序( applet)技术提供了一个与GDB中的基因 图谱和物理图谱相连的图形界面,并使网页能够合并“活性内容”( acti ve content) 1995)。一个能使用Java微程序的网络浏览器应服从以下规则:它们应含有 Mi crosoft Internet Explorer(3.0版本或更高)和№ escape Navi gator(2.0版本或更 高) 首先,要连上GDB,需连到GDB主页上的浏览器。从这个网址上,再找到并选择标有 Advanced Search(高级搜索)的链接,从而得到一个含有几种查询方式的页面 最简单的查询方式名为按址搜索( Search Maps by Location)。如图12.5,选择这一项后会 出现一个表。要使用这个表,得先选择要演示的染色体或亚染色体区域。如果要看整条染色 体,可从pop-up菜单中直接选择。而要看一个染色体区域的话,就要在输入栏From和To (从..到..)中输入两个细胞遗传学带或基因标记物的名称 搜索窗口下方的两个滚动式列表允许用户自己限制所搜索的图和标记物的种类。例如,可以 限制STSS(在GDB用语中为“扩增引物" ampl i mer)只用于放射性杂交图中的情况 让我们从标有 Submi t(提交)的按钮开始。在短时间等待后,将出现一个滚动列表,包括所 有符合要求的图谱。一般都会有基因型、细胞遗传型和物理型图谱 现在对感兴趣的图再按 Submi t。因为每个图都要花时间来获取和演示,所以除非使用速度很 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
㽕ᛇᇚϔᓴEntrez ᄬ⫼᠋ⲬϞˈৃऩߏ哴ᷛে䬂˄MachintochϞⱘShift-Click 䬂˅ˈᔍߎにষϞᮍⱘCursorˈ✊ৢӮѻ⫳ϔϾpop-up㦰ऩˈ䗝ᢽSave Image As˄ᇚᔶᄬ Ў˅ᑊ䕧ܹϔϾৡ⿄Ў䆹ᔶ᭛ӊⱘ᭛ӊৡDŽ䆹ᔶҹGIFᔶᓣֱᄬˈৃҹᕜᔶᑣ Ёࡴҹᰒ⼎ǃᠧॄ᪡DŽ䖭Ͼ䖛ϡৠⱘ㔥㒰⌣㾜఼Ё⬹᳝ϡৠˈ᳝ⱘ㽕∖⚍ߏ⠛ ࠡ䗝ᢽFile˄᭛ӊ˅㦰ऩЁ᳝ᷛSave next Link to Disk˄ᇚϟϔϾ䫒ᄬⲬ˅ϔ乍DŽ 䰸Ҏ㉏㒘ˈEntrez䖬ᦤկ݇Ѣ哴㉏ǃᵰ㴛ǃC.elegansǃ䝉↡ҹঞϔѯॳ⫳ࡼ⠽ⱘ䈅DŽ ሑㅵৃ↨䕗ⱘ˄ৠ㒓ᗻ˅ҡϡৃ㦋ᕫˈԚᅗҷ㸼њ⦄᳔᳔ᅠᭈⱘϔ༫⫳⠽ԧⱘ 䈅ֵᙃDŽ ሑㅵҹ㔥㒰⌣㾜Entrezᇍϔ㠀ⱘՓ⫼Ꮖ㒣䎇ˈℸᴹ⑤Փ⫼乥⥛催ⱘҎ䖬ᰃᛇᓎゟϔϾ Entrez㔥キˈेNCBI“キᶰৄāˈҹ乒ᅶˉˉ᳡ࡵਬⱘᔶᓣՓ⫼䕃ӊDŽ䖭⾡ᔶᓣϢ㔥㒰⠜⡍ ᕕϔ㟈ˈԚҢᅲ䋼Ϟৃҹདഄᑨ⫼ˈ㗠Ϩ⬠䴶㕢㾖DŽᅗ䗖⫼ѢWindowsǃMacintoshUnix ㄝ㋏㒳ˈᑊৃEntrez Overview˄ܼ㾜˅义Ϟϟ䕑DŽ Entrezг᳝ϔᅮⱘ䰤ࠊDŽ᳔Ϲ䞡ⱘᰃ⬅辵ᮍ⊩ᵘᓎⱘ䈅ϡᕫϡՓ⫼ৠϔതᷛ㋏㒳DŽ䖭⾡ ㅔ࣪ˈ⒵䎇њᇚ᠔᳝㸼⼎ৠϔऎඳⱘᔶৠᯊᰒ⼎ⱘ䳔㽕ˈԚ᳝ᯊг佄њ݊䈅ֵᙃễ ϸৃᄬⳒⱘ⡍⚍ˈࠊ䗴ߎᑊϡᄬⱘ⹂ᅮᗻⱘ؛䈵ˈ⡍߿ᰃ㒚㚲䘫Ӵᄺ⠽⧚ ⠛ǃ䈅ⱘᭈড়݇㋏ᑊϡ㋻ᆚˈᖙ乏ᇣᖗՓ⫼DŽᔧ✊ˈEntrezгϔѯᅲ偠ᅸࠊⱘ㔥 义Ⳍ䖲ˈᅗӀᦤկ䈅ᴹ⑤ˈ䖭ህՓ䈅㛑ֱᣕᅲ偠ᅸ᳔ᐌ⫼ⱘ᳔ᮄⱘᔶᓣDŽ䖭ѯϾԧЁ ᖗⱘ䈅ᇚৢ䴶䆺㒚ⱘҟ㒡DŽ GDBЁ⌣㾜ᶧ㡆ԧ ϔ⾡ᐌ㾕ⱘҎ㉏⠽⧚䈅᭄ⱘᴹ⑤ᰃGDBDŽሑㅵGDBᰃѢᔧᯊ䈅ⱘ䞡㽕ᗻᠡᵘᓎ 䍋ᴹⱘˈԚᰃ᳔䖥ᑈᴹˈGDBгᏆ㒣䖯㸠њᠽᓎ䞡㒘ˈ⦄ৠḋৃҹㅫᰃ⠽⧚䈅᭄ⱘҧ ᑧDŽϡ䈵NCBIˈGDBা䰤ѢҎ㉏䈅᭄DŽᅗϡᑣ᭄߫ˈг≵᳝݊ᅗ⾡㉏⫳⠽ⱘֵᙃDŽ ৠNCBIϔḋˈGDBৃҹ⬅WWWϞᕫࠄDŽGDBᦤկњϔ⾡ܼࡳ㛑ⱘᇍ᭄݊ᑧⱘᶹ䆶ᓣ⬠䴶ˈ䖭ϔ ⚍ˈሑㅵᕜ᳝⫼ˈᇍᮄᴹ䇈ৃ㛑䖬ᰃӮᕜ༈⮐DŽ䰤ࠊᗻᔎⱘᶹ䆶⬠䴶ˈࣙᣀϔ⾡Āᣝഔ ᶹāⱘࡳ㛑ˈ㛑ᐂࡽԴⳈ䖯ܹGDBˈ⡍߿ᰃ1996ᑈ12᳜ᓩܹⱘGDBⱘ㾚ˉᑣ ˄Mapview 2 program˅ˈᅗ߽⫼ᮄⱘJavaᖂᑣ˄applet˅ᡔᴃᦤկњϔϾϢGDBЁⱘ 䈅⠽⧚䈅Ⳍ䖲ⱘᔶ⬠䴶ˈᑊՓ㔥义㛑ড়ᑊĀ⌏ᗻݙᆍā˄active content˅ ˄Anuff, 1995˅DŽϔϾ㛑Փ⫼Javaᖂᑣⱘ㔥㒰⌣㾜఼ᑨ᳡Ңҹϟ㾘߭˖ᅗӀᑨ᳝ Microsoft Internet Explorer˄3.0⠜ᴀ催˅Netscape Navigator˄2.0⠜ᴀ 催˅DŽ 佪ܜˈ㽕䖲ϞGDBˈ䳔䖲ࠄGDBЏ义Ϟⱘ⌣㾜఼DŽҢ䖭Ͼ㔥ഔϞˈݡᡒࠄᑊ䗝ᢽ᳝ᷛAdvanced Search˄催㑻᧰㋶˅ⱘ䫒ˈҢ㗠ᕫࠄϔϾ᳝辵ᶹ䆶ᮍᓣⱘ义䴶DŽ ᳔ㅔऩⱘᶹ䆶ᮍᓣৡЎᣝഔ᧰㋶˄Search Maps by Location˅DŽབ12.5ˈ䗝ᢽ䖭ϔ乍ৢӮ ߎ⦃ϔϾ㸼DŽ㽕Փ⫼䖭Ͼ㸼ˈᕫܜ䗝ᢽ㽕ⓨ⼎ⱘᶧ㡆ԧѮᶧ㡆ԧऎඳDŽབᵰ㽕ⳟᭈᴵᶧ㡆 ԧˈৃҢpop-up㦰ऩЁⳈ䗝ᢽDŽ㗠㽕ⳟϔϾᶧ㡆ԧऎඳⱘ䆱ˈህ㽕䕧ܹᷣFromTo ˄Ң...ࠄ˅...Ё䕧ܹϸϾ㒚㚲䘫Ӵᄺᏺᷛ䆄⠽ⱘৡ⿄DŽ ᧰㋶にষϟᮍⱘϸϾ⒮ࡼᓣ߫㸼ܕ䆌⫼᠋㞾Ꮕ䰤ࠊ᠔᧰㋶ⱘᷛ䆄⠽ⱘ⾡㉏DŽ՟བˈৃҹ 䰤ࠊSTSs˄GDB⫼䇁ЁЎĀᠽᓩ⠽”amplimer˅া⫼ѢᬒᇘᗻᴖѸЁⱘᚙމDŽ 䅽៥ӀҢ᳝ᷛSubmit˄ᦤѸ˅ⱘᣝ䪂ᓔྟDŽⷁᯊ䯈ㄝᕙৢˈᇚߎ⦃ϔϾ⒮ࡼ߫㸼ˈࣙᣀ᠔ ᳝ヺড়㽕∖ⱘ䈅DŽϔ㠀䛑Ӯ᳝ൟǃ㒚㚲䘫Ӵൟ⠽⧚ൟ䈅DŽ ⦄ᇍᛳ݈䍷ⱘݡᣝSubmitDŽЎ↣Ͼ䛑㽕㢅ᯊ䯈ᴹ㦋পⓨ⼎ˈ᠔ҹ䰸䴲Փ⫼䗳ᑺᕜ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ4/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,5/1 快的网络连接,最好将同时浏览的图谱的数目限制在3个以内 图谱被整理后,将会打开一个新的窗口,以肩并肩的方式演示被选中的图(如图12.6),两 个或多个图中均用到的标记物用线相连,应注意有时也存在矛盾现象。 要得到演示图谱中一个标记物的其它信息,可双击它的名称。浏览器窗口将会返回前一页并 演示所选标记物在GDB中的词条。这个词条将会包括与GDB中其它信息的超链接( hyperl i nk) (如目录词条)和一些其它的生物数据库 要得到制图方法的信息或关于一张特定图的其它信息,双击其垂直的主干,得到一张网页 描述图谱并给出详尽的信息。(警告:不要关掉 Mapi ew,后的浏览器窗口,由于Java安全性的 一个特点,微程序只有当浏览器窗口开着时才能演示关于所选标记物的信息)。 Mapi ew(图片演示)中的演示可通过选择iew(演示)菜单中的 Marker Names(标记物名 称)或 Di spl ay Options(演示选项)来调整。这些选项可以让用户开或者关某些图的演 改变图谱的相对摆放顺序、并熟练选择标记物的名称。标记物被演示时默认为使用其基因座D 片断名。但有时候如果使用最初实验室里的命名,信息量将会更大,因为这会对标记物的 本质提供一些线索(例如,它是微卫星重复片断,还是一段表达序列) 要在图上搜索一个特定的标记物,应从Edit(编辑)菜单中选择Find(寻找)一项。输入 个或多个标记物的名称再按0K按钮。标记物的任何别名都能使用,也可用一个单*号,被选中 的标记物高亮度显示并滚动到视野内 来自个体来源的基因组范围图谱 尽管一级数据库,如Eηtrez和GDB是已发表的图谱的重要来源,但是它们还没有能替代原始数 据的东西。有能力制作自己的物理图谱的实验室一般都有自己的网址,连向它们的图谱数据 库。通过从这一渠道直接获取资料,我们可以看到制图实验室所使用的图的形式、下载原始 数据、并且了解实验室制图时的协议。另外,一些图在出现于Eηtrez和GDB前经常被丢掉。 Entrez和GDB数据库选择的表达方式,对那些希望将新的标记物定位于已知物理图谱上的研究 者来说,只提供了最小的帮助 基因组的基因图谱 尽管本章讨论的是物理图谱的来源,但若不涉及基因图谱,这些讨论就不能算全面,因为后 者是制作许多物理图谱时工作的基本骨架,也是许多制图项目的起点。有两种基因组范围的 基因图谱可供选择。 Genethon图( Dib et a.,19%6)含5264个多样性微卫星重复片断,间 隔1.6cM。完整的数据库文件,以及图谱的 PostScri pt方式图形表示,在 Gene thon的FTP站点 上均可获得,这些图通过GDB也可以获得 第二大基因图谱由 Cooperati ve Human Li nkage Center(公用人类链接中心)( Murray et a|.,1994)制造,CHLC图由10775个标记物组成,大多数为微卫星重复片断,间隔3.7cM。 人类基因组的转录物图 在1996年10月, Horno sapiens的一个全基因组转录物图由一个国际合作的研究实验室发表于 Science上( Schuler et a.,1996)。这个图由~15000个不同的表达序列组成,由放射性 杂交法定位,与 Genethon基因图谱衍生的框架相近。通过对酵母人工染色体作STS含量法又增 添了1000个表达序列。在这张图中,大约1/5的标记物有已知的或是假定的功能,而余下的代 表了未知功能的表达序列。制成图的序列一般由 Uni geneset衍生而来,它是一个由NCB管理 的公用重复ESTs数据库。 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
ᖿⱘ㔥㒰䖲ˈ᳔དᇚৠᯊ⌣㾜ⱘ䈅ⱘ᭄Ⳃ䰤ࠊϾҹݙDŽ 䈅㹿ᭈ⧚ৢˈᇚӮᠧᓔϔϾᮄⱘにষˈҹ㙽ᑊ㙽ⱘᮍᓣⓨ⼎㹿䗝Ёⱘ˄བ12.6˅ˈϸ ϾϾЁഛ⫼ࠄⱘᷛ䆄⠽⫼㒓Ⳍ䖲ˈᑨ⊼ᛣ᳝ᯊгᄬⳒ⦄䈵DŽ 㽕ᕫࠄⓨ⼎䈅ЁϔϾᷛ䆄⠽ⱘ݊ᅗֵᙃˈৃঠߏᅗⱘৡ⿄DŽ⌣㾜఼にষᇚӮ䖨ಲࠡϔ义ᑊ ⓨ⼎᠔䗝ᷛ䆄⠽GDBЁⱘ䆡ᴵDŽ䖭Ͼ䆡ᴵᇚӮࣙᣀϢGDBЁ݊ᅗֵᙃⱘ䍙䫒˄hyperlink˅ ˄བⳂᔩ䆡ᴵ˅ϔѯ݊ᅗⱘ⫳⠽᭄ᑧDŽ 㽕ᕫࠊࠄᮍ⊩ⱘֵᙃ݇Ѣϔᓴ⡍ᅮⱘ݊ᅗֵᙃˈঠߏൖ݊ⳈⱘЏᑆˈᕫࠄϔᓴ㔥义ˈ ᦣ䗄䈅ᑊ㒭ߎ䆺ሑⱘֵᙃDŽ˄䄺ਞ˖ϡ㽕݇ᥝMapviewৢⱘ⌣㾜఼にষˈ⬅ѢJavaᅝܼᗻⱘ ϔϾ⡍⚍ˈᖂᑣা᳝ᔧ⌣㾜఼にষᓔⴔᯊᠡ㛑ⓨ⼎݇Ѣ᠔䗝ᷛ䆄⠽ⱘֵᙃ˅DŽ Mapview˄⠛ⓨ⼎˅Ёⱘⓨ⼎ৃ䗮䖛䗝ᢽView˄ⓨ⼎˅㦰ऩЁⱘMarker Names˄ᷛ䆄⠽ৡ ⿄˅Display Options˄ⓨ⼎䗝乍˅ᴹ䇗ᭈDŽ䖭ѯ䗝乍ৃҹ䅽⫼᠋ᓔ㗙݇ᶤѯⱘⓨ⼎ǃ ᬍব䈅ⱘⳌᇍᨚᬒ乎ᑣǃᑊ❳㒗䗝ᢽᷛ䆄⠽ⱘৡ⿄DŽᷛ䆄⠽㹿ⓨ⼎ᯊ咬䅸ЎՓ⫼݊ᑻD ˉ⠛ᮁৡDŽԚ᳝ᯊབᵰՓ⫼᳔߱ᅲ偠ᅸ䞠ⱘੑৡˈֵᙃ䞣ᇚӮˈЎ䖭Ӯᇍᷛ䆄⠽ⱘ ᴀ䋼ᦤկϔѯ㒓㋶˄՟བˈᅗᰃᖂि᯳䞡⠛ᮁˈ䖬ᰃϔ↉㸼䖒ᑣ߫˅DŽ 㽕Ϟ᧰㋶ϔϾ⡍ᅮⱘᷛ䆄⠽ˈᑨҢEdit˄㓪䕥˅㦰ऩЁ䗝ᢽFind˄ᇏᡒ˅ϔ乍DŽ䕧ܹϔ ϾϾᷛ䆄⠽ⱘৡ⿄ݡᣝOKᣝ䪂DŽᷛ䆄⠽ⱘӏԩ߿ৡ䛑㛑Փ⫼ˈгৃ⫼ϔϾऩ োˈ㹿䗝Ё ⱘᷛ䆄⠽催҂ᑺᰒ⼎ᑊ⒮ࠄࡼ㾚䞢ݙDŽ ᴹ㞾Ͼԧᴹ⑤ⱘ㒘㣗ೈ䈅 ሑㅵϔ㑻᭄ᑧˈབEntrezGDBᰃᏆথ㸼ⱘ䈅ⱘ䞡㽕ᴹ⑤ˈԚᰃᅗӀ䖬≵᳝㛑᳓ҷॳྟ᭄ ⱘϰ㽓DŽ᳝㛑ࠊ㞾Ꮕⱘ⠽⧚䈅ⱘᅲ偠ᅸϔ㠀䛑᳝㞾Ꮕⱘ㔥ഔˈ䖲ᅗӀⱘ䈅᭄ ᑧDŽ䗮䖛Ң䖭ϔ⏴䘧Ⳉ㦋প䌘᭭ˈ៥Ӏৃҹⳟࠊࠄᅲ偠ᅸ᠔Փ⫼ⱘⱘᔶᓣǃϟ䕑ॳྟ ᭄ǃᑊϨњ㾷ᅲ偠ᅸࠊᯊⱘण䆂DŽˈϔѯߎ⦃ѢEntrezGDBࠡ㒣ᐌ㹿϶ᥝDŽ EntrezGDB᭄ᑧ䗝ᢽⱘ㸼䖒ᮍᓣˈᇍ䙷ѯᏠᳯᇚᮄⱘᷛ䆄⠽ᅮԡѢᏆⶹ⠽⧚䈅Ϟⱘⷨお 㗙ᴹ䇈ˈাᦤկњ᳔ᇣⱘᐂࡽDŽ 㒘ⱘ䈅 ሑㅵᴀゴ䅼䆎ⱘᰃ⠽⧚䈅ⱘᴹ⑤ˈԚ㢹ϡ⍝ঞ䈅ˈ䖭ѯ䅼䆎ህϡ㛑ㅫܼ䴶ˈЎৢ 㗙ᰃࠊ䆌⠽⧚䈅ᯊᎹⱘᴀ偼ᶊˈгᰃ䆌ࠊ乍Ⳃⱘ䍋⚍DŽ᳝ϸ⾡㒘㣗ೈⱘ 䈅ৃկ䗝ᢽDŽGenethon˄Dib et al., 1996˅5264Ͼḋᗻᖂि᯳䞡⠛ᮁˈ䯈 䱨1.6cMDŽᅠᭈⱘ᭄ᑧ᭛ӊˈҹঞ䈅ⱘPostScriptᮍᓣᔶ㸼⼎ˈGenethonⱘFTPキ⚍ Ϟഛৃ㦋ᕫˈ䖭ѯ䗮䖛GDBгৃҹ㦋ᕫDŽ Ѡ䈅⬅Cooperative Human Linkage Center˄݀⫼Ҏ㉏䫒Ёᖗ˅˄Murray et al., 1994˅ࠊ䗴ˈCHLC⬅10775Ͼᷛ䆄⠽㒘៤ˈ᭄Ўᖂि᯳䞡⠛ᮁˈ䯈䱨3.7cMDŽ Ҏ㉏㒘ⱘ䕀ᔩ⠽ 1996ᑈ10᳜ˈHorno sapiensⱘϔϾܼ㒘䕀ᔩ⠽⬅ϔϾ䰙ড়ⱘⷨおᅲ偠ᅸথ㸼Ѣ ScienceϞ˄Schuler et al., 1996˅DŽ䖭Ͼ⬅̚15000Ͼϡৠⱘ㸼䖒ᑣ߫㒘៤ˈ⬅ᬒᇘᗻ ᴖѸ⊩ᅮԡˈϢGenethon䈅㸡⫳ⱘḚᶊⳌ䖥DŽ䗮䖛ᇍ䝉↡ҎᎹᶧ㡆ԧSTS䞣⊩জ ⏏њ1000Ͼ㸼䖒ᑣ߫DŽ䖭ᓴЁˈ㑺1/5ⱘᷛ䆄⠽᳝Ꮖⶹⱘᰃ؛ᅮⱘࡳ㛑ˈ㗠ԭϟⱘҷ 㸼њⶹࡳ㛑ⱘ㸼䖒ᑣ߫DŽࠊ៤ⱘᑣ߫ϔ㠀⬅UniGeneset㸡⫳㗠ᴹˈᅗᰃϔϾ⬅NCBIㅵ⧚ ⱘ݀⫼䞡ESTs᭄ᑧDŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ5/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,6/1 转录物图是通过将八家不同实验室的图谱数据综合而得到的。为协调制图方法的些微不同, 表达序列被放在由 Genethon基因图谱衍生的框架上。结果,该图的最大分辨率为~2CM。很多 情况下,可以从各个实验室的数据库里得到针对某一部分数据更好的制图信息,特别是the Whi tehead insti tute和 Stanford Uni versi ty的。 浏览NCB转录物图 转录物图可在两个网址上得到。数据的“亲本”站点为NCB。在那儿可以找到含有全基因组 转录物图的 Science文章的全文,以及彩色的图象,但一般都只有装饰性的墙面图案。另外, 也有搜索页可以让浏览者对特别感兴趣的基因进行查询,或是通过对功能未知,但其读码框 与某已知功能的蛋白质相近的表达序列图谱进行搜索 NCB网址的一个限制就是它不能在低分辨率标记物分布柱形图上提供转录物图的图形。但是 通过 Mapi ew微程序就可以得到其图形显示。从GDB的首页,沿着What'sNew的链接,可找到 全基因组转录物图(到本书出版时链接形式可能已有所不同)。同样,可以认为转录物图也 是 Entrez网将要制作的一部分 任何支持网络浏览器的计算机系统都可用来浏览NCB转录物图,要求是应连向 Internet并支 持TCP/P。通过 nternet服务器可能形成一个 dedi cated网络连接或是一个拨号连接。因为这 个网址图形不多,所以连接速度不要求很快 首先,点击 Science转录物图网页所在的浏览器,得到转录物图的主页,通过其鲜快的桃红背 景很容易认出它。现在,寻找并点击标有 Reasearch Tool s Page(研究工具页)的链接。 般这个链接很不起眼(它在该页的右方,图的下方),这个链接会引向一个有几种搜索方式 的窗口,你可以按址、按假定功能或只按序列进行搜索 要想搜索基因组的一个特定区域中特殊目的基因的图谱,可选择标有 Map Search(搜索图 谱)的链接,得到含有一列染色体的页面。选择感兴趣的染色体,得到与图12.7相似的页 面。现在,在标有 Interval(间隔)栏中,输入两个 Gene thon基因标记物来定义你感兴趣的 区域 Genethon图可从GDB得到,或直接在上面所给的URL上的 Gene thon中得到。例如,如图12.7所 示,要搜索位于染色体18的 Gene thon图上32cM和34cM中的表达序列,可输入D18S464 D18S153,再按 Select Markers(选择标记物)键开始搜索,得到列有目标区域中表达序列 的页面(图12.7),其中每个EST位于不同列,并有简短说明。附言“ Hi ghl y si mi l ar to 或“ Si mi l ar to”说明它不对应已知基因,但与 Swi ss-Prot中的某个基因相似 每个转录物的名称都是一个超文字链接。选择此链接会产生一个页面,对转录物进行详细说 明。在可获得信息中有重叠基因表、形成转录物群的ESTS、CDNA的准备原始材料,转录物的 克隆1D(在1.M.A.G. E Consorti um的网页可得到大多数ESTs的克隆号)、 Swiss-Prot相似性 搜索结果,以及 Entrez中关于其序列和词条信息的链接。 要想根据名称或假定功能搜索一个图中的转录物,应回到搜索页并选择 Text search(主题搜 索)。接着会弹出一页,上面有一个或多个搜索项。你可以搜索以下类型的内容, Gen Bank中 的一个通道号、一个标记物或地点名称、在转录物 Gen Bank词条的说明区内找到的一个说明性 词语、或是在 Swiss-Prot词条的说明区内找到的说明性词语,转录物与之很相似。你可以同 时限定很多搜索项,这样搜索系统会挑出含所有项的那些词条。 按 Search搜索键提交搜索,将会出现一列符合条件的转录物,其形式与前所述搜索的图谱相 似。例如搜索 krabi n(角蛋白)通常会得到17种 keratin和与 keratin相似的转录物,并指出 它们在图中的位置 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
䕀ᔩ⠽ᰃ䗮䖛ᇚܿᆊϡৠᅲ偠ᅸⱘ䈅᭄㓐ড়㗠ᕫࠄⱘDŽЎण䇗ࠊᮍ⊩ⱘѯᖂϡৠˈ 㸼䖒ᑣ߫㹿ᬒ⬅Genethon䈅㸡⫳ⱘḚᶊϞDŽ㒧ᵰˈ䆹ⱘ᳔ߚ䕼⥛Ў̚2cMDŽᕜ ᚙމϟˈৃҹҢϾᅲ偠ᅸⱘ᭄ᑧ䞠ᕫࠄ䩜ᇍᶤϔ䚼ߚ᭄དⱘࠊֵᙃˈ⡍߿ᰃthe Whitehead InstituteStanford UniversityⱘDŽ ⌣㾜NCBI䕀ᔩ⠽ 䕀ᔩ⠽ৃϸϾ㔥ഔϞᕫࠄDŽ᭄ⱘĀ҆ᴀāキ⚍ЎNCBIDŽ䙷ܓৃҹᡒࠄܼ᳝㒘 䕀ᔩ⠽ⱘScience᭛ゴⱘܼ᭛ˈҹঞᔽ㡆ⱘ䈵ˈԚϔ㠀䛑া᳝㺙佄ᗻⱘ䴶ḜDŽˈ г᳝᧰㋶义ৃҹ䅽⌣㾜㗙ᇍ⡍߿݈ᛳ䍷ⱘ䖯㸠ᶹ䆶ˈᰃ䗮䖛ᇍࡳ㛑ⶹˈԚ݊䇏ⷕḚ ϢᶤᏆⶹࡳ㛑ⱘ㲟ⱑ䋼Ⳍ䖥ⱘ㸼䖒ᑣ߫䈅䖯㸠᧰㋶DŽ NCBI㔥ഔⱘϔϾ䰤ࠊህᰃᅗϡ㛑Ԣߚ䕼⥛ᷛ䆄⠽ߚᏗ᷅ᔶϞᦤկ䕀ᔩ⠽ⱘᔶDŽԚᰃ 䗮䖛Mapviewᖂᑣህৃҹᕫࠄ݊ᔶᰒ⼎DŽҢGDBⱘ佪义ˈ⊓ⴔWhat’s Newⱘ䫒ˈৃᡒࠄ ܼ㒘䕀ᔩ⠽˄ࠄᴀкߎ⠜ᯊ䫒ᔶᓣৃ㛑Ꮖ᳝᠔ϡৠ˅DŽৠḋˈৃҹ䅸Ў䕀ᔩ⠽г ᰃEntrez㔥ᇚ㽕ࠊⱘϔ䚼ߚDŽ ӏԩᬃᣕ㔥㒰⌣㾜఼ⱘ䅵ㅫᴎ㋏㒳䛑ৃ⫼ᴹ⌣㾜NCBI䕀ᔩ⠽ˈ㽕∖ᰃᑨ䖲Internetᑊᬃ ᣕTCP/IPDŽ䗮䖛Internet᳡ࡵৃ఼㛑ᔶ៤ϔϾdedicated㔥㒰䖲ᰃϔϾᢼো䖲DŽЎ䖭 Ͼ㔥ഔᔶϡˈ᠔ҹ䖲䗳ᑺϡ㽕∖ᕜᖿDŽ 佪ܜ⚍ˈߏScience䕀ᔩ⠽㔥义᠔ⱘ⌣㾜఼ˈᕫࠄ䕀ᔩ⠽ⱘЏ义ˈ䗮䖛݊剰ᖿⱘḗ㑶㚠 ᱃ᕜᆍᯧ䅸ߎᅗDŽ⦄ˈᇏᡒᑊ⚍ߏ᳝ᷛReasearch Tools Page˄ⷨおᎹ义˅ⱘ䫒DŽϔ 㠀䖭Ͼ䫒ᕜϡ䍋ⴐ˄ᅗ䆹义ⱘেᮍˈⱘϟᮍ˅ˈ䖭Ͼ䫒ӮᓩϔϾ᳝᧰辵㋶ᮍᓣ ⱘにষˈԴৃҹᣝഔǃᣝ؛ᅮࡳ㛑াᣝᑣ߫䖯㸠᧰㋶DŽ 㽕ᛇ᧰㋶㒘ⱘϔϾ⡍ᅮऎඳЁ⡍⅞Ⳃⱘⱘ䈅ˈৃ䗝ᢽ᳝ᷛMap Search˄᧰㋶ 䈅˅ⱘ䫒ˈᕫࠄ᳝ϔ߫ᶧ㡆ԧⱘ义䴶DŽ䗝ᢽᛳ݈䍷ⱘᶧ㡆ԧˈᕫࠄϢ12.7ⳌԐⱘ义 䴶DŽ⦄ˈ᳝ᷛInterval˄䯈䱨˅ᷣЁˈ䕧ܹϸϾGenethonᷛ䆄⠽ᴹᅮНԴᛳ݈䍷ⱘ ऎඳDŽ GenethonৃҢGDBᕫࠄˈⳈϞ䴶᠔㒭ⱘURLϞⱘGenethonЁᕫࠄDŽ՟བˈབ12.7᠔ ⼎ˈ㽕᧰㋶ԡѢᶧ㡆ԧ18ⱘGenethonϞ32cM34cMЁⱘ㸼䖒ᑣ߫ˈৃ䕧ܹD18S464ˉ D18S1153ˈݡᣝSelect Markers˄䗝ᢽᷛ䆄⠽˅䬂ᓔྟ᧰㋶ˈᕫࠄ᳝߫ⳂᷛऎඳЁ㸼䖒ᑣ߫ ⱘ义䴶˄12.7˅ˈ݊Ё↣ϾESTԡѢϡৠ߫ˈᑊ᳝ㅔⷁ䇈ᯢDŽ䰘㿔“Highly similar to” “Similar to”䇈ᯢᅗϡᇍᑨᏆⶹˈԚϢSwiss-ProtЁⱘᶤϾⳌԐDŽ ↣Ͼ䕀ᔩ⠽ⱘৡ⿄䛑ᰃϔϾ䍙᭛ᄫ䫒DŽ䗝ᢽℸ䫒Ӯѻ⫳ϔϾ义䴶ˈᇍ䕀ᔩ⠽䖯㸠䆺㒚䇈 ᯢDŽৃ㦋ᕫֵᙃЁ᳝䞡㸼ǃᔶ៤䕀ᔩ⠽㕸ⱘESTsǃcDNAⱘޚྟॳᴤ᭭ˈ䕀ᔩ⠽ⱘ ܟ䱚ID˄I.M.A.G.E Consortiumⱘ㔥义ৃᕫࠄ᭄ESTsⱘܟ䱚ো˅ǃSwiss-ProtⳌԐᗻ ᧰㋶㒧ᵰˈҹঞEntrezЁ݇Ѣ݊ᑣ߫䆡ᴵֵᙃⱘ䫒DŽ 㽕ᛇḍৡ⿄؛ᅮࡳ㛑᧰㋶ϔϾЁⱘ䕀ᔩ⠽ˈᑨಲࠄ᧰㋶义ᑊ䗝ᢽText Search˄Џ乬᧰ ㋶˅DŽⴔӮᔍߎϔ义ˈϞ䴶᳝ϔϾϾ᧰㋶乍DŽԴৃҹ᧰㋶ҹϟ㉏ൟⱘݙᆍˈGenBankЁ ⱘϔϾ䗮䘧োǃϔϾᷛ䆄⠽ഄ⚍ৡ⿄ǃ䕀ᔩ⠽GenBank䆡ᴵⱘ䇈ᯢऎݙᡒࠄⱘϔϾ䇈ᯢᗻ 䆡䇁ǃᰃSwiss-Prot䆡ᴵⱘ䇈ᯢऎݙᡒࠄⱘ䇈ᯢᗻ䆡䇁ˈ䕀ᔩ⠽ϢПᕜⳌԐDŽԴৃҹৠ ᯊ䰤ᅮᕜ᧰㋶乍ˈ䖭ḋ᧰㋶㋏㒳Ӯᣥߎ᠔᳝乍ⱘ䙷ѯ䆡ᴵDŽ ᣝSearch᧰㋶䬂ᦤѸ᧰㋶ˈᇚӮߎ⦃ϔ߫ヺড়ᴵӊⱘ䕀ᔩ⠽ˈ݊ᔶᓣϢࠡ᠔䗄᧰㋶ⱘ䈅Ⳍ ԐDŽ՟བ᧰㋶kerabin˄㾦㲟ⱑ˅䗮ᐌӮᕫࠄ17⾡keratinϢkeratinⳌԐⱘ䕀ᔩ⠽ˈᑊᣛߎ ᅗӀЁⱘԡ㕂DŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ6/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,7/1 搜索的最终类型取决于 BLAST相似性,如要搜索与一段DNA序列相似的转录物图,在搜索页上 选择“序列搜索”,弹出一个很大的输入区。用 FASTA模式将目的序列剪切后粘贴在输入区 先在>后加上序列名称(任意标记物均可),再加入该序列,如下 > bl undergo obi n3′end CTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCCTGTGCAGCATTCCATAAT GTGAATATATAACACTTTATTCAAAATTTGGGGAAATAGTACCTTGTACATACA TAATTTCACATGTTTGCCAGTGTGTGTTTTAGATACATGCCTGGA 如该序列在 Gen Bank中已有一词条,那么只要输入其通道号就可以了。按下 Submi t Query(提 交要求)键。在被查询序列对照转录物序列进行一次 BLAST搜索后,NCB|服务器将会给出一页 结果,总结所有相似转录物的身份和图中位置 Whi te head i nsti tute提供的人类物理图谱 The Whi tehead i nti tute/Mi t center for genome research是两张基因组范围物理图谱的最 初来源。其中一张是STS含量图,内含指定为YAC的10000多个标记物,以及一张含12000个左 右标记物的放射性杂交图。 Whi tohead所用的G4杂交板( Genebri dge4 radi ati on hybri d pane)分辨率为~1Mbp,而以YAC为基础作的图分辨率大约为200kbp。这些图已经和 Genethon基因图相结合,产生了一张合图,在平均150kb范围内有20000个STSs。 Whi tohead图 上大约有一半的标记物是表达序列,它们在人类转录物图上也会出现。 Wl( Whi tehead insti tute)图可通过网络从 Whi tehead center for genome research的主页 上得到。沿着“人类物理图项目”( Human Physi cal Mappi ng Project)的链接就可以得到 感兴趣的图,这些图可通过几种方法浏览。选择一系列pop-up菜单可以产生所选染色体的 图,选择选项按钮可以综合放射性杂交图、STS含量图和基因图。与Eηtrez一样,这些图不是 固定不变的。点击一个STS或是重叠群,会弹出关于该图素详细信息的页面。图形式图谱在网 址上可按GlF或 Maci tosh最初模式(PCT)下载。最近引入的一个多图浏览器,有一个望文 生义的名称 Mul ti map(多图)可以为Java型浏览器(如图12.8)提供这些图详尽的信息。这 些图的后转录形式在 Whi tohead ftp站点上也可得到。但应注意,这些后转录图是一些长几英 尺,与墙壁差不多尺寸的怪物。这就需要一个有足够内存(至少8M)的激光打印机或标绘器 才能进行硬拷贝。 Whi tohead网址上还提供了对图谱数据库进行査询的搜索页。这些搜索数据的链接可按名称 Gen Bank通道号、STS型号、染色体分配进行搜索。另外, Whi behead网页也可根据功能关键字 搜索制图转录序列,并提供与NCB|中的主转录物图的链接 Whi behead也为那些希望建立他们自己的STS的研究者提供服务,并将之放在一个或多个图 上,这些服务包括 一个在线的引物选择程序,引物3 将一个STS放在 STS/YAC含量图上的服务 将一个STS放在放射性杂交图上的服务 Whi tohead图远未完善,对合图进行监督性测试就能显示出在基因图、放射性杂交图和 STS/YAC图上的STSs位置间存在矛盾。这些矛盾表现在合图上仍存在交叉线。解释这些图的 个关键点在于理解这些图在可靠性与分辨率水平不一。基因图骨架在数十兆时能可靠地连接 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
᧰㋶ⱘ᳔㒜㉏ൟপއѢBLASTⳌԐᗻˈབ㽕᧰㋶Ϣϔ↉DNAᑣ߫ⳌԐⱘ䕀ᔩ⠽ˈ᧰㋶义Ϟ 䗝ᢽĀᑣ߫᧰㋶āˈᔍߎϔϾᕜⱘ䕧ܹऎDŽ⫼FASTAᓣᇚⳂⱘᑣ߫ߛ࠾ৢ㉬䌈䕧ܹऎ˗ ܜৢ!ࡴϞᑣ߫ৡ⿄˄ӏᛣᷛ䆄⠽ഛৃ˅ˈࡴݡܹ䆹ᑣ߫ˈབϟ˖ >blunderglobin 3’end CTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCCTGTGCAGCATTCCATAAT GTGAATATATAACACTTTATTCAAAATTTGGGGAAATAGTACCTTGTACATACA TAATTTCACATGTTTGCCAGTGTGTGTTTTAGATACATGCCTGGA བ䆹ᑣ߫GenBankЁᏆ᳝ϔ䆡ᴵˈ䙷Мা㽕䕧ܹ݊䗮䘧োህৃҹњDŽᣝϟSubmit Query˄ᦤ Ѹ㽕∖˅䬂DŽ㹿ᶹ䆶ᑣ߫ᇍ✻䕀ᔩ⠽ᑣ߫䖯㸠ϔBLAST᧰㋶ৢˈNCBI᳡ࡵ఼ᇚӮ㒭ߎϔ义 㒧ᵰˈᘏ㒧᠔᳝ⳌԐ䕀ᔩ⠽ⱘ䑿ӑЁԡ㕂DŽ White head InstituteᦤկⱘҎ㉏⠽⧚䈅 The Whitehead Intitute/MIT Center for Genome Researchᰃϸᓴ㒘㣗ೈ⠽⧚䈅ⱘ᳔ ߱ᴹ⑤DŽ݊ЁϔᓴᰃSTS䞣ˈݙᣛᅮЎYACⱘ10000Ͼᷛ䆄⠽ˈҹঞϔᓴ12000ϾᎺ েᷛ䆄⠽ⱘᬒᇘᗻᴖѸDŽWhitehead᠔⫼ⱘG4ᴖѸᵓ˄Genebridge 4 radiation hybrid panel˅ߚ䕼⥛Ў̚1Mbpˈ㗠ҹYACЎ⸔ⱘߚ䕼⥛㑺Ў200kbpDŽ䖭ѯᏆ㒣 GenethonⳌ㒧ড়ˈѻ⫳њϔᓴড়ˈᑇഛ150kb㣗ೈݙ᳝20000ϾSTSsDŽWhitehead Ϟ㑺᳝ϔञⱘᷛ䆄⠽ᰃ㸼䖒ᑣ߫ˈᅗӀҎ㉏䕀ᔩ⠽ϞгӮߎ⦃DŽ WI˄Whitehead Institute˅ৃ䗮䖛㔥㒰ҢWhitehead Center for Genome ResearchⱘЏ义 ϞᕫࠄDŽ⊓ⴔĀҎ㉏⠽⧚乍Ⳃā˄Human Physical Mapping Project˅ⱘ䫒ህৃҹᕫࠄ ᛳ݈䍷ⱘˈ䖭ѯৃ䗮䖛辵ᮍ⊩⌣㾜DŽ䗝ᢽϔ㋏߫pop-up㦰ऩৃҹѻ⫳᠔䗝ᶧ㡆ԧⱘ ˈ䗝ᢽ䗝乍ᣝ䪂ৃҹ㓐ড়ᬒᇘᗻᴖѸǃSTS䞣DŽϢEntrezϔḋˈ䖭ѯϡᰃ ᅮϡবⱘDŽ⚍ߏϔϾSTSᰃ䞡㕸ˈӮᔍߎ݇Ѣ䆹㋴䆺㒚ֵᙃⱘ义䴶DŽᔶᓣ䈅㔥 ഔϞৃᣝGIFMacintosh᳔߱ᓣ˄PICT˅ϟ䕑DŽ᳔䖥ᓩܹⱘϔϾ⌣㾜఼ˈ᳝ϔϾᳯ᭛ ⫳Нⱘৡ⿄Multimap˄˅ৃҹЎJavaൟ⌣㾜఼˄བ12.8˅ᦤկ䖭ѯ䆺ሑⱘֵᙃDŽ䖭 ѯⱘৢ䕀ᔩᔶᓣWhitehead FTPキ⚍ϞгৃᕫࠄDŽԚᑨ⊼ᛣˈ䖭ѯৢ䕀ᔩᰃϔѯ䭓㣅 ሎˈϢຕᏂϡሎᇌⱘᗾ⠽DŽ䖭ህ䳔㽕ϔϾ᳝䎇ݙᄬ˄㟇ᇥ8M˅ⱘ▔ܝᠧॄᴎᷛ㒬఼ ᠡ㛑䖯㸠⹀ᣋ䋱DŽ Whitehead㔥ഔϞ䖬ᦤկњᇍ䈅᭄ᑧ䖯㸠ᶹ䆶ⱘ᧰㋶义DŽ䖭ѯ᧰㋶᭄ⱘ䫒ৃᣝৡ⿄ǃ GenBank䗮䘧োǃSTSൟোǃᶧ㡆ԧߚ䜡䖯㸠᧰㋶DŽˈWhitehead㔥义гৃḍࡳ㛑݇䬂ᄫ ᧰㋶ࠊ䕀ᔩᑣ߫ˈᑊᦤկϢNCBIЁⱘЏ䕀ᔩ⠽ⱘ䫒DŽ WhiteheadгЎ䙷ѯᏠᳯᓎゟҪӀ㞾ᏅⱘSTS ⱘⷨお㗙ᦤկ᳡ࡵˈᑊᇚПᬒϔϾϾ Ϟˈ䖭ѯ᳡ࣙࡵᣀ˖ ϔϾ㒓ⱘᓩ⠽䗝ᢽᑣˈᓩ⠽3 ᇚϔϾSTSᬒSTS/YAC䞣Ϟⱘ᳡ࡵ ᇚϔϾSTSᬒᬒᇘᗻᴖѸϞⱘ᳡ࡵ Whitehead䖰ᅠˈᇍড়䖯㸠ⲥⴷᗻ⌟䆩ህ㛑ᰒ⼎ߎǃᬒᇘᗻᴖѸ STS/YACϞⱘSTSsԡ㕂䯈ᄬⳒDŽ䖭ѯⳒ㸼⦄ড়ϞҡᄬѸঝ㒓DŽ㾷䞞䖭ѯⱘϔ Ͼ݇䬂⚍Ѣ⧚㾷䖭ѯৃ䴴ᗻϢߚ䕼⥛∈ᑇϡϔDŽ偼ᶊ᭄कܚᯊ㛑ৃ䴴ഄ䖲 कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ7/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,8/1 标记物,但在低于约2兆时就无法准确解决两个STS的顺序问题了。放射性杂交图能够测知约 10Mb的连接,有效分辨率达~1Mb(更小的间隔也能排序,但是不可靠性逐步增加) STS/YAC图可以测知两个相互间隔1Mb的STS的连接,估计分辨力达100~300kb。理解图谱时头 脑中应有这些尺度上的差异。一般在1Mb的范围以下,STS/YAC图是说明顺序的图谱中最可靠 的一种 在STS含量图中,由于STS和YAC的不等分布,可靠性也会有地域差异。在YAC密集的区域(每 一个STS有5个或更多的YAC),在排序信息的重要性上,图谱结果是相对更可靠的。在低密度 区,图谱结果中就会有几种同时可能替代的STS顺序,并会附上数据。假定的错误的反面情 况,如图12.8中,表示为图中的空白框。这一点也会严重降低图谱的准确性。最后,因为在 所有YAC库中都存在嵌合现象的问题,双键(例如,一对STS同时与2个或更多YAC连接)比单 键(STS只由1个YAC连接)更能可靠说明相邻关系。尽管只有在基因图或放射性杂交图中存在 支持性数据时,图上才能构建单键信息,但单由两个STS相连形成的连接仍保留怀疑。这些元 素在任何制图区域被详细检查的时候都应考虑在内。 下面的部分介绍如何在 Whi tohead图上,通过 Whi tohead网址安置新的STS。从STS设计和针对 Whi behead和放射性杂交图进行制图开始 设计一个STS,置于 Whi tohead上 设计一个STS需要一个高质量的DNA序列,至少长达所需的PCR产物。为得到最好的结果,这些 序列应不含重复元素和载体序列,并且质量相对高些。任何支持一个WW浏览器的计算机系统 都可以使用该程序,支持TCP/P的网络连接也是必须的 首先,将浏览器连到 Whi tehead Genome Center的主页。寻找并点击指向 MW Pri mer Pi cki ng 的链接。接着出现一页,在其上方有一个很大的输入框。剪切原始序列并粘贴到该处,只用 粘贴原始序列,不需用名称或其它标记词。这些碱基可以小写或大写,而白色空格可以忽 略 现在,向下滚动窗口,将PCR的条件调至需要值。那些关于盐浓度、温度和产物大小范围等的 默认值均是Ⅵ所设定的。如果有必要的改变需输入时,按标有 Pick pri mers键返回一套引物 处进行特定设定。这些引物现在在对感兴趣的序列的审查实验中用得上。通过放大基因组DNA 中的一条特定带,可以对这些引物的能力进行经验性鉴定。引物的失败主要与引物扫描区域 中的重复元素有关。相反,通过进行 BLAST或 FASTA搜索,再选择引物对,来对输入序列中的 重复序列进行筛选则是比较明智的,如果STS成功地放大了一条特定带,它就可以与 Whi tohead sts/TAC含量图或放射性杂交图相联系,被制成图。 与 Whi tohead sts/YAC含量图联系对STS制图 一旦被制出后,一个STS就可以通过对 CEPT mega-YAC库的扫描确定在STS/YAC含量图上的位 置。而对含有超过30000个克隆,其中又有1200个排列、板块和柱池(row、 plate和 col um pool)的YAC库进行搜索,实在是一件头疼的任务。可喜的是,几个生物技术公司己经提供了 CEPH YAC的复本和(或)筛选系统,包括 Research Geneti cs Corporati on。 Whi tohead图就 是仅从YAC库的后一部分构建起来的。这意味着库模块中位于709—972的范围仍需筛选。STS 接着就可以用以下步骤放在图上了。 使浏览器连向 Whi tohead的主页,并点击标有 Human Physi Mappi ng Proj ect的链接以跳到 该组织的物理制图页。从这儿,再找到并选择“ Search for a yac to i ts address”,接着 出现一页,内有一系列pop-up菜单,能用于输入单个YAC的地址、或一个输入单个YAC名称的 主题栏、或一个能粘贴 AC地址的大型区域。后者适用于将多个YAC用于研究的时候。在 这个地方输入YAC列表,再使用“ pl ate_ row col umn”形式,这里是用“_”号分离板块、排 和列这三维(如709A_1),也可输入多个YAC地址,用空格或 carrI age回车隔开。搜索过程 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
ᷛ䆄⠽ˈԚԢѢ㑺ܚᯊህ᮴⊩ޚ⹂㾷އϸϾSTSⱘ乎ᑣ䯂乬њDŽᬒᇘᗻᴖѸ㛑⌟ⶹ㑺 10Mbⱘ䖲ˈ᳝ᬜߚ䕼⥛䖒̚1Mb˄ᇣⱘ䯈䱨г㛑ᥦᑣˈԚᰃϡৃ䴴ᗻ䗤ℹࡴ˅DŽ STS/YACৃҹ⌟ⶹϸϾⳌѦ䯈䱨1MbⱘSTSⱘ䖲ˈԄ䅵ߚ䕼䖒100̚300kbDŽ⧚㾷䈅ᯊ༈ 㛥Ёᑨ᳝䖭ѯሎᑺϞⱘᏂᓖDŽϔ㠀1Mbⱘ㣗ೈҹϟˈSTS/YACᰃ䇈ᯢ乎ᑣⱘ䈅Ё᳔ৃ䴴 ⱘϔ⾡DŽ STS䞣Ёˈ⬅ѢSTSYACⱘϡㄝߚᏗˈৃ䴴ᗻгӮ᳝ഄඳᏂᓖDŽYACᆚ䲚ⱘऎඳ˄↣ ϔϾSTS᳝ϾⱘYAC˅ˈᥦᑣֵᙃⱘ䞡㽕ᗻϞˈ䈅㒧ᵰᰃⳌᇍৃ䴴ⱘDŽԢᆚᑺ ऎˈ䈅㒧ᵰЁህӮ᳝辵ৠᯊৃ㛑᳓ҷⱘSTS乎ᑣˈᑊӮ䰘Ϟ᭄DŽ؛ᅮⱘ䫭䇃ⱘড䴶ᚙ މˈབ12.8Ёˈ㸼⼎ЎЁⱘぎⱑḚDŽ䖭ϔ⚍гӮϹ䞡䰡Ԣ䈅ⱘޚ⹂ᗻDŽ᳔ৢˈЎ ᠔᳝YACᑧЁ䛑ᄬጠড়⦄䈵ⱘ䯂乬ˈঠ䬂˄՟བˈϔᇍSTSৠᯊϢϾYAC䖲˅↨ऩ 䬂˄STSা⬅ϾYAC䖲˅㛑ৃ䴴䇈ᯢⳌ䚏݇㋏DŽሑㅵা᳝ᬒᇘᗻᴖѸЁᄬ ᬃᣕᗻ᭄ᯊˈϞᠡ㛑ᵘᓎऩ䬂ֵᙃˈԚऩ⬅ϸϾSTSⳌ䖲ᔶ៤ⱘ䖲ҡֱ⬭ᗔ⭥DŽ䖭ѯܗ ㋴ӏԩࠊऎඳ㹿䆺㒚Ẕᶹⱘᯊ䛑ᑨ㗗㰥ݙDŽ ϟ䴶ⱘ䚼ߚҟ㒡བԩWhiteheadϞˈ䗮䖛Whitehead㔥ഔᅝ㕂ᮄⱘSTSDŽҢSTS䆒䅵䩜ᇍ WhiteheadᬒᇘᗻᴖѸ䖯㸠ࠊᓔྟDŽ 䆒䅵ϔϾSTSˈ㕂ѢWhiteheadϞ 䆒䅵ϔϾSTS䳔㽕ϔϾ催䋼䞣ⱘDNAᑣ߫ˈ㟇ᇥ䭓䖒᠔䳔ⱘPCRѻ⠽DŽЎᕫࠄ᳔དⱘ㒧ᵰˈ䖭ѯ ᑣ߫ᑨϡ䞡ܗ㋴䕑ԧᑣ߫ˈᑊϨ䋼䞣Ⳍᇍ催ѯDŽӏԩᬃᣕϔϾWWW⌣㾜఼ⱘ䅵ㅫᴎ㋏㒳 䛑ৃҹՓ⫼䆹ᑣˈᬃᣕTCP/IPⱘ㔥㒰䖲гᰃᖙ乏ⱘDŽ 佪ܜˈᇚ⌣㾜఼䖲ࠄWhitehead Genome CenterⱘЏ义DŽᇏᡒᑊ⚍ߏᣛWWW Primer Picking ⱘ䫒DŽⴔߎ⦃ϔ义ˈ݊Ϟᮍ᳝ϔϾᕜⱘ䕧ܹḚDŽߛ࠾ྟॳᑣ߫ᑊ㉬䌈ࠄ䆹໘ˈা⫼ ㉬䌈ॳྟᑣ߫ˈϡ䳔⫼ৡ⿄݊ᅗᷛ䆄䆡DŽ䖭ѯ⺅ৃҹᇣݭݭˈ㗠ⱑ㡆ぎḐৃҹᗑ ⬹DŽ ⦄ˈϟ⒮ࡼにষˈᇚPCRⱘᴵӊ䇗㟇䳔㽕ؐDŽ䙷ѯ݇ѢⲤ⌧ᑺǃ⏽ᑺѻ⠽ᇣ㣗ೈㄝⱘ 咬䅸ؐഛᰃWI᠔䆒ᅮⱘDŽབᵰ᳝ᖙ㽕ⱘᬍব䳔䕧ܹᯊˈᣝ᳝ᷛPick Primers䬂䖨ಲϔ༫ᓩ⠽ ໘䖯㸠⡍ᅮ䆒ᅮDŽ䖭ѯᓩ⠽⦄ᇍᛳ݈䍷ⱘᑣ߫ⱘᅵᶹᅲ偠Ё⫼ᕫϞDŽ䗮䖛ᬒ㒘DNA Ёⱘϔᴵ⡍ᅮᏺˈৃҹᇍ䖭ѯᓩ⠽ⱘ㛑䖯㸠㒣偠ᗻ䡈ᅮDŽᓩ⠽ⱘ༅䋹Џ㽕Ϣᓩ⠽ᠿᦣऎඳ Ёⱘ䞡ܗ㋴᳝݇DŽⳌডˈ䗮䖛䖯㸠BLASTFASTA᧰㋶ˈݡ䗝ᢽᓩ⠽ᇍˈᴹᇍ䕧ܹᑣ߫Ёⱘ 䞡ᑣ߫䖯㸠ㄯ䗝߭ᰃ↨䕗ᯢᱎⱘˈབᵰSTS៤ࡳഄᬒњϔᴵ⡍ᅮᏺˈᅗህৃҹϢ Whitehead STS/TAC䞣ᬒᇘᗻᴖѸⳌ㘨㋏ˈ㹿ࠊ៤DŽ ϢWhitehead STS/YAC䞣㘨㋏ᇍSTSࠊ ϔᮺ㹿ߎࠊˈৢϔϾSTSህৃҹ䗮䖛ᇍCEPT mega-YACᑧⱘᠿᦣ⹂ᅮSTS/YAC䞣Ϟⱘԡ 㕂DŽ㗠ᇍ᳝䍙䖛30000Ͼܟ䱚ˈ݊Ёজ᳝1200Ͼᥦ߫ǃᵓഫ᷅∴˄rowǃplatecolumn pool˅ⱘYACᑧ䖯㸠᧰㋶ˈᅲᰃϔӊ༈⮐ⱘӏࡵDŽৃ୰ⱘᰃˈϾ⫳⠽ᡔᴃ݀ৌᏆ㒣ᦤկњ CEPH YACⱘᴀ˄˅ㄯ䗝㋏㒳ˈࣙᣀResearch Genetics CorporationDŽWhiteheadህ ᰃҙҢYACᑧⱘৢϔ䚼ߚᵘᓎ䍋ᴹⱘDŽ䖭ᛣੇⴔᑧഫЁԡѢ709ˉ972ⱘ㣗ೈҡ䳔ㄯ䗝DŽSTS ⴔህৃҹ⫼ҹϟℹ偸ᬒϞњDŽ Փ⌣㾜఼䖲WhiteheadⱘЏ义ˈᑊ⚍ߏ᳝ᷛHuman Physical Mapping Projectⱘ䫒ҹ䏇ࠄ 䆹㒘㒛ⱘ⠽⧚ࠊ义DŽҢ䖭ܓˈݡᡒࠄᑊ䗝ᢽ“Search for a YAC to its address”ˈⴔ ߎ⦃ϔ义ˈݙ᳝ϔ㋏߫pop-up㦰ऩˈ㛑⫼Ѣ䕧ܹऩϾYACⱘഄഔǃϔϾ䕧ܹऩϾYACৡ⿄ⱘ Џ乬ᷣǃϔϾ㛑㉬䌈ϔ߫YACഄഔⱘൟऎඳDŽৢ㗙䗖⫼ѢᇚϾYAC⫼ѢⷨおⱘᯊDŽ 䖭Ͼഄᮍ䕧ܹYAC߫㸼ˈݡՓ⫼“plate_row_column”ᔶᓣˈ䖭䞠ᰃ⫼“_”োߚ行ᵓഫǃᥦ ߫䖭ϝ㓈˄བ709_A_1˅ˈгৃ䕧ܹϾYACഄഔˈ⫼ぎḐcarriageಲ䔺䱨ᓔDŽ᧰㋶䖛 कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ8/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,9/1 输入格式并不固定,它也可识别多个YAC模式(包括709a1和709a1) 当YAC表完成后,按 Search键,得到一个表,列有各个YAC,其重叠群位置和染色体分配,以 及附近STS的位置。这些STS位于放射性杂交图和(或)基因图上(见例1)。 要理解该搜索结果,应该知道CEPH库中相当数量(40-50%)的克隆都是嵌合体,这意味着 单个YAC可能存在于位于基因组不同部分的重叠群中。由于这个原因,需要找到多个YAC来证 明单个STS分配到了某一特定重叠群中,或是从其它方法来证明(比如FISH,体细胞杂交制 图,放射性杂交图制图数据)。 1.将一个STS置于 Whi tohead sts/YAC含量图中 作为一个具体的例子,让我们考虑在YAC库中筛选的位于3个YAC中的一个STS:945B6 743_G_12和765_D_8,将它们的地址输入网页后,按 Search键,回到以下页面(为清晰起见这 儿有几处缩写) 945B6 Posi ti oi n Conti g STS Chrom Geneti c RH Singl e Double 1D18s59 Chr18 WC18.0WC-1465 2D18s1140 Chr18 WC18.0WC-1465 3 CHLC. GGAT2G04 1217 Chr18 WC18.0WC-1465 4 CHLC. GGAT2G04 Chr18 WC18.0WC-1465 5W-9527 Chr18 6W-7796 Chr18 15CR WC18.0 743_6_12 Posi tioi n Conti g STS Chrom Genetic RH Singl e Double 1D18s1140 Chr18 WC180 WC 1465 2 CHLC, GGAT2G04 Chr18 WC18.0 1465 3W-9527 Chr18 WC180 WC 1465 4D18S59 Chr18 WC180 WC 1465 5 CHLC, GGAT2G04, 1217 Chr18 1465 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
䕧ܹḐᓣᑊϡᅮˈᅗгৃ䆚߿ϾYACᓣ˄ࣙᣀ709_a_1709a1˅DŽ ᔧYAC㸼ᅠ៤ৢˈᣝSearch䬂ˈᕫࠄϔϾ㸼ˈ᳝߫ϾYACˈ݊䞡㕸ԡ㕂ᶧ㡆ԧߚ䜡ˈҹ ঞ䰘䖥STSⱘԡ㕂DŽ䖭ѯSTSԡѢᬒᇘᗻᴖѸ˄˅Ϟ˄㾕՟˅DŽ 㽕⧚㾷䆹᧰㋶㒧ᵰˈᑨ䆹ⶹ䘧CEPHᑧЁⳌᔧ᭄䞣˄40ˉ50ˁ˅ⱘܟ䱚䛑ᰃጠড়ԧˈ䖭ᛣੇⴔ ऩϾYACৃ㛑ᄬѢԡѢ㒘ϡৠ䚼ߚⱘ䞡㕸ЁDŽ⬅Ѣ䖭Ͼॳˈ䳔㽕ᡒࠄϾYACᴹ䆕 ᯢऩϾSTSߚ䜡ࠄњᶤϔ⡍ᅮ䞡㕸ЁˈᰃҢ݊ᅗᮍ⊩ᴹ䆕ᯢ˄↨བFISHˈԧ㒚㚲ᴖѸࠊ ˈᬒᇘᗻᴖѸࠊ᭄˅DŽ 1. ᇚϔϾSTS㕂ѢWhitehead STS/YAC䞣Ё ЎϔϾԧⱘ՟ᄤˈ䅽៥Ӏ㗗㰥YACᑧЁㄯ䗝ⱘԡѢϾYACЁⱘϔϾSTS˖945_B_6ˈ 743_G_12765_D_8ˈᇚᅗӀⱘഄഔ䕧ܹ㔥义ৢˈᣝSearch䬂ˈಲࠄҹϟ义䴶˄Ў⏙᱄䍋㾕䖭 DŽ˅ݭ໘㓽᳝ܓ 945_B_6 743_G_12 Map Positioin Contig STS Chrom Genetic RH Single Double 1 D18S59 Chr18 - - WC18.0 WC-1465 2 D18S1140 Chr18 - - WC18.0 WC-1465 3 CHLC.GGAT2G04.1217 Chr18 - - WC18.0 WC-1465 4 CHLC.GGAT2G04 Chr18 - - WC18.0 WC-1465 5 WI-9527 Chr18 - - WC18.0 WC-1465 6 WI-7796 Chr18 - 15cR WC18.0 - Map Positioin Contig STS Chrom Genetic RH Single Double 1 D18S1140 Chr18 - - WC18.0 WC- 1465 2 CHLC.GGAT2G04 Chr18 - - WC18.0 WC- 1465 3 WI-9527 Chr18 - - WC18.0 WC- 1465 4 D18S59 Chr18 - - WC18.0 WC- 1465 5 CHLC.GGAT2G04.1217 Chr18 - - WC18.0 WC- 1465 कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ9/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,10/1 6W-7796 Chr18 15CR WC18.0 8D6S1634 Chr WC6.12 1197 9W-3308 Chr 584cR WC6. 12 WC 1197 10FB10A2 Chr17 424cR WC178 WC 11 AFM198YB2 Chr 32CR WC5.0 WC-596 12 CHLC. GATA82H02 Chr WC5.0 WC-596 13D5S406 Chr WC5.0 WC-596 765D8 Posi toin Conti g STS Chrom 39CM RH Double 1D14S69 Chr14 WC-1651 2 AFMA133WF1 Chr14 C14.0 3D18s1105 Chr18 WC18.0 WC-909 4W-5528 Chr18 4CR WC18.0 5W-3058 Chr11 5CR WC18.0 WC-909 6W-5872 Chr11 145cR WC11.4 7W-6096 Chr11 143cR WC11.4 每张图对应输入的一个YAC地址,每个表包括已知YAC中的STS表,以及STS制图信息。对于每 个STS,染色体分配、基因图位置和放射性杂交图位置只要已知就会给出。另外,STS所属的 已命名的重叠群也列成表,这些表中大多数元素是超文字链接,选择合适的链接可以获得关 于一个STS或一个重叠群更多的信息。由于历史原因,许多STS有两个重叠群。双链接重叠群 (例如由成对YAC共有的重叠群)短一些,在构图的起始阶段中是可创造的更可靠的重叠群, 它们可以被放心地忽略。单个重叠群长一些,在不同方式下也应承认其合理性。 在此例中,三个YAC中有两个似乎有嵌合性,因为它们散布于几个不同的染色体的重叠群中, 很显然这三个YAC都有WC18.0重叠群,这就使尝试性的将STS分配至这个重叠群成为可能,因 为从重叠群的其它STS的基因图和放射性杂交图位置我们知道W18.0位于染色体18上,并靠 Whi tohead放射性杂交图 STS也能被置于 Whi tohead放射性杂交图中,这比STS/YAC含量图的问题简单很多,因为在放射 性杂交图上搜索一个STS只用93次PCR,而不是1000次。 Whi tohead放射性杂交图使用 Genebri dge4 radi ati on hybri d panel。与 CEPH YAC库一样,这些细胞谱系的DNA也可以从 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
765_D_8 ↣ᓴᇍᑨ䕧ܹⱘϔϾYACഄഔˈ↣Ͼ㸼ࣙᣀᏆⶹYACЁⱘSTS㸼ˈҹঞSTSࠊֵᙃDŽᇍѢ↣ ϾSTSˈᶧ㡆ԧߚ䜡ǃԡ㕂ᬒᇘᗻᴖѸԡ㕂া㽕ᏆⶹህӮ㒭ߎDŽˈSTS᠔ሲⱘ Ꮖੑৡⱘ䞡㕸г߫៤㸼ˈ䖭ѯ㸼Ё᭄ܗ㋴ᰃ䍙᭛ᄫ䫒ˈ䗝ᢽড়䗖ⱘ䫒ৃҹ㦋ᕫ݇ ѢϔϾSTSϔϾ䞡㕸ⱘֵᙃDŽ⬅Ѣग़ॳˈ䆌STS᳝ϸϾ䞡㕸DŽঠ䫒䞡㕸 ˄՟བ⬅៤ᇍYAC᳝݅ⱘ䞡㕸˅ⷁϔѯˈᵘⱘ䍋ྟ䰊↉Ёᰃৃ߯䗴ⱘৃ䴴ⱘ䞡㕸ˈ ᅗӀৃҹ㹿ᬒᖗഄᗑ⬹DŽऩϾ䞡㕸䭓ϔѯˈϡৠᮍᓣϟгᑨᡓ䅸݊ড়⧚ᗻDŽ ℸ՟ЁˈϝϾYACЁ᳝ϸϾԐТ᳝ጠড়ᗻˈЎᅗӀᬷᏗѢϾϡৠⱘᶧ㡆ԧⱘ䞡㕸Ёˈ ᕜᰒ✊䖭ϝϾYAC䛑᳝WC18.0䞡㕸ˈ䖭ህՓᇱ䆩ᗻⱘᇚSTSߚ䜡㟇䖭Ͼ䞡㕸៤Ўৃ㛑ˈ ЎҢ䞡㕸ⱘ݊ᅗSTS ⱘᬒᇘᗻᴖѸԡ㕂៥Ӏⶹ䘧WC18.0ԡѢᶧ㡆ԧ18Ϟˈᑊ䴴 䖥3ッDŽ WhiteheadᬒᇘᗻᴖѸ STSг㛑㹿㕂ѢWhiteheadᬒᇘᗻᴖѸЁˈ䖭↨STS/YAC䞣ⱘ䯂乬ㅔऩᕜˈЎᬒᇘ ᗻᴖѸϞ᧰㋶ϔϾSTSা⫼93PCRˈ㗠ϡᰃ1000DŽWhiteheadᬒᇘᗻᴖѸՓ⫼ Genebridge 4 radiation hybrid panelDŽϢCEPH YACᑧϔḋˈ䖭ѯ㒚㚲䈅㋏ⱘDNAгৃҹҢ 6 WI-7796 Chr18 - 15cR WC18.0 - 8 D6S1634 Chr6 96cM - WC6.12 WC- 1197 9 WI-3308 Chr6 - 584cR WC6.12 WC- 1197 10 FB10A2 Chr17 - 424cR WC17.8 WC- 1673 11 AFM198YB2 Chr5 - 32cR WC5.0 WC-596 12 CHLC.GATA82H02 Chr5 - - WC5.0 WC-596 13 D5S406 Chr5 12cM - WC5.0 WC-596 Map Positioin Contig STS Chrom 39cM RH Single Double 1 D14S69 Chr14 - - WC14.0 WC-1651 2 AFMA133WF1 Chr14 1cM - WC14.0 WC-1651 3 D18S1105 Chr18 - - WC18.0 WC-909 4 WI-5528 Chr18 - 4cR WC18.0 - 5 WI-3058 Chr11 - 5cR WC18.0 WC-909 6 WI-5872 Chr11 - 145cR WC11.4 - 7 WI-6096 Chr11 - 143cR WC11.4 - कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ10/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com