正在加载图片...
第一章因特网与生物学家 页码,1/ Q 第一章因特网与生物学家 随着硏究者可用的序列与结枃信息的爆炸式增长,生物信息学领域,或更精确地说是计算生 物学领域,在基础生物医疗问题的研究中起着越来越大的作用。计算生物学家面临的挑战, 尤其是由人类基因组计划以及其它测序工作生成的大量数据带来的挑战,将对发现基因和设 计分子模型、定点突变,以及其它有可能发现基因与蛋白质的结构与功能的未知关系的实验 有所帮助。 在开始实际讨论解决生物问题的计算方法之前,必须先明确一个共同的背景,从而使用户可 以访问和使用本书中讨论的算法和工具。我们首先回顾了因特网及其有关术语,并讨论了四 种主要的因特网协议族,但不深入涉及协议的技术细节。关于这些协议的内部处理过程的详 细描述可以参考(Falk,1994:Kro,1994),这是给外行人看的好书。 因特网基础 尽管“因特网”听起来象一个单独的实体,但它实际上是一个网络的网络,由超过20,000个 分布在100多个国家中的相互连接的本地网或地区网构成。虽然有关远程通讯的工作在六十年 代初就已经开始,但因特网的真正起源还是1969年美国国防部远景研究规划局( Advanced Research Proj ects Agency,ARPA)的网络研究计划 ARPANET。 ARPANET最初连接了美国西海 岸的四个节点,其直接目的是在实验室之间传输有关国防的研究信息。随后又开展了一系列 的网络研究项目,并在10年后达到了另一个里程碑式的阶段。1981年引入的B|TNET( Because lt' s Time)在大学之间提供点对点的电子邮件和文件传输,1982年ARPA引入了传输控制协议 (TCP)以及因特网协议(IP),TCP/P使得不同的网络可以连接起来并进行通讯,从而形成 了现在的系统。很多文献详细介绍了因特网的发展历程和通讯协议,但大多数用户关心的只 是因特网在工作,而非具体的工作原理。 当网络中的计算机连接在一起的时候,需要有一种方法来明确表示每一台计算机,从而使消 息和文件真正找到它们的接收者。为此,所有与因特网直接相连的计算机都必须有一个|P地 址,IP地址是唯一的,标识且只能标识一台计算机。IP地址由四个以点号分隔的数字构成 如美国国立健康研究院(NH)生物技术信息中心(NCB)的主文件服务器的P地址是 130.14.25.1。从左到右这些数字表示的是:主域(130.14表示NH)、子网(.25表示NH的 国家药物实验室),以及这台计算机(.1)。虽然采用数字式的P地址可以帮助计算机定位 数据,但用户记忆起来却非常困难,所以P地址通常都有相对应的正式域名(FQDN),由域 名服务器在后台将其动态翻译成IP地址。回到前面NCB的例子,用户更愿意用 ncbi. nl m ni h.gov而不是130.1425.1来访问NCB的那台计算机。必须注意的是,从左向右P 地址的定位范围由大到小,而FQ叭N的定位范围则由小到大。因此,任意指定的计算机的名称 都可以看成是具有如下的格式:计算机.域,其中顶级域名(FODN中最后一个点号后面的部 分)分为六个大类(见表1.1)。在美国之外的国家,顶级域名则是用两个字符表示的计算机 所在国家(例如,Ca表示加拿大,,表示联合王国)。 表1.1顶级域名 对因特网规模(即因特网的成功程度)的最具体度量,就是计算物理上接入因特网的计算机的 数量。网络 zards通过运行一个探测器去尽可能地寻找主机,并把探测结果返回到运行探测 器的计算机上,从而定期地计算这些计算机(或主机)的数量。主机数量的增长速度非常显 著,大约每12个月增加一倍,目前主机总数已经超过了12,000,000台。这一增长的绝大部分 来自商业部门,例如万维网等投资于日益大众化的新多媒体广告与通讯平台(图1.1)。由于 可能有许多探测器找不到的主机,这一统计数字的绝对数目不会很精确,它只适用于考察因 特网的发展趋势,以及和其它数据进行比较研究。例如:有许多计算机被设置在防火墙后 面,出于安全的考虑而阻止了公司内部与外部的通讯;其它一些计算机,尤其是家用计算 机,只通过调制解调器与因特网短暂相连。所以最好把网络 Wi zard的搜索结果只看成是代表 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18㄀ϔゴ ಴⡍㔥Ϣ⫳⠽ᄺᆊ 䱣ⴔⷨお㗙ৃ⫼ⱘᑣ߫Ϣ㒧ᵘֵᙃⱘ⟚⚌ᓣ๲䭓ˈ⫳⠽ֵᙃᄺ乚ඳˈ៪᳈㊒⹂ഄ䇈ᰃ䅵ㅫ⫳ ⠽ᄺ乚ඳˈ೼෎⸔⫳⠽ए⭫䯂乬ⱘⷨおЁ䍋ⴔ䍞ᴹ䍞໻ⱘ԰⫼DŽ䅵ㅫ⫳⠽ᄺᆊ䴶Јⱘᣥ៬ˈ ᇸ݊ᰃ⬅Ҏ㉏෎಴㒘䅵ߦҹঞ݊ᅗ⌟ᑣᎹ԰⫳៤ⱘ໻䞣᭄᥂ᏺᴹⱘᣥ៬ˈᇚᇍথ⦄෎಴੠䆒 䅵ߚᄤ῵ൟǃᅮ⚍さবˈҹঞ݊ᅗ᳝ৃ㛑থ⦄෎಴Ϣ㲟ⱑ䋼ⱘ㒧ᵘϢࡳ㛑ⱘ᳾ⶹ݇㋏ⱘᅲ偠 ᳝᠔ᐂࡽDŽ ೼ᓔྟᅲ䰙䅼䆎㾷އ⫳⠽䯂乬ⱘ䅵ㅫᮍ⊩Пࠡˈᖙ乏ܜ⹂ᯢϔϾ݅ৠⱘ㚠᱃ˈҢ㗠Փ⫼᠋ৃ ҹ䆓䯂੠Փ⫼ᴀкЁ䅼䆎ⱘㅫ⊩੠Ꮉ݋DŽ៥Ӏ佪ܜಲ乒њ಴⡍㔥ঞ᳝݊݇ᴃ䇁ˈᑊ䅼䆎њಯ ⾡Џ㽕ⱘ಴⡍㔥ण䆂ᮣˈԚϡ⏅ܹ⍝ঞण䆂ⱘᡔᴃ㒚㡖DŽ݇Ѣ䖭ѯण䆂ⱘݙ䚼໘⧚䖛⿟ⱘ䆺 㒚ᦣ䗄ৃҹখ㗗˄Falkˈ1994˗Krolˈ1994˅ˈ䖭ᰃ㒭໪㸠ҎⳟⱘདкDŽ ಴⡍㔥෎⸔ ሑㅵĀ಴⡍㔥ā਀䍋ᴹ䈵ϔϾऩ⣀ⱘᅲԧˈԚᅗᅲ䰙ϞᰃϔϾ㔥㒰ⱘ㔥㒰ˈ⬅䍙䖛20,000Ͼ ߚᏗ೼100໮Ͼ೑ᆊЁⱘⳌѦ䖲᥹ⱘᴀഄ㔥៪ഄऎ㔥ᵘ៤DŽ㱑✊᳝݇䖰⿟䗮䆃ⱘᎹ԰೼݁कᑈ ҷ߱ህᏆ㒣ᓔྟˈԚ಴⡍㔥ⱘⳳℷ䍋⑤䖬ᰃ1969ᑈ㕢೑೑䰆䚼䖰᱃ⷨお㾘ߦሔ˄Advanced Research Projects AgencyˈARPA˅ⱘ㔥㒰ⷨお䅵ߦARPANETDŽARPANET᳔߱䖲᥹њ㕢೑㽓⍋ ኌⱘಯϾ㡖⚍ˈ݊Ⳉ᥹Ⳃⱘᰃ೼ᅲ偠ᅸП䯈Ӵ䕧᳝݇೑䰆ⱘⷨおֵᙃDŽ䱣ৢজᓔሩњϔ㋏߫ ⱘ㔥㒰ⷨお乍Ⳃˈᑊ೼10ᑈৢ䖒ࠄњ঺ϔϾ䞠⿟⹥ᓣⱘ䰊↉DŽ1981ᑈᓩܹⱘBITNET˄Because It's Time˅೼໻ᄺП䯈ᦤկ⚍ᇍ⚍ⱘ⬉ᄤ䚂ӊ੠᭛ӊӴ䕧ˈ1982ᑈARPAᓩܹњӴ䕧᥻ࠊण䆂 ˄TCP˅ҹঞ಴⡍㔥ण䆂˄IP˅ˈTCP/IPՓᕫϡৠⱘ㔥㒰ৃҹ䖲᥹䍋ᴹᑊ䖯㸠䗮䆃ˈҢ㗠ᔶ៤ њ⦄೼ⱘ㋏㒳DŽᕜ໮᭛⤂䆺㒚ҟ㒡њ಴⡍㔥ⱘথሩग़⿟੠䗮䆃ण䆂ˈԚ໻໮᭄⫼᠋݇ᖗⱘা ᰃ಴⡍㔥೼Ꮉ԰ˈ㗠䴲݋ԧⱘᎹ԰ॳ⧚DŽ ᔧ㔥㒰Ёⱘ䅵ㅫᴎ䖲᥹೼ϔ䍋ⱘᯊ׭ˈ䳔㽕᳝ϔ⾡ᮍ⊩ᴹᯢ⹂㸼⼎↣ϔৄ䅵ㅫᴎˈҢ㗠Փ⍜ ᙃ੠᭛ӊⳳℷᡒࠄᅗӀⱘ᥹ᬊ㗙DŽЎℸˈ᠔᳝Ϣ಴⡍㔥Ⳉ᥹Ⳍ䖲ⱘ䅵ㅫᴎ䛑ᖙ乏᳝ϔϾIPഄ ഔˈIPഄഔᰃଃϔⱘˈᷛ䆚Ϩা㛑ᷛ䆚ϔৄ䅵ㅫᴎDŽIPഄഔ⬅ಯϾҹ⚍োߚ䱨ⱘ᭄ᄫᵘ៤ˈ བ㕢೑೑ゟعᒋⷨお䰶˄NIH˅⫳⠽ᡔᴃֵᙃЁᖗ˄NCBI˅ⱘЏ᭛ӊ᳡ࡵ఼ⱘIPഄഔᰃ 130.14.25.1DŽҢᎺࠄে䖭ѯ᭄ᄫ㸼⼎ⱘᰃ˖Џඳ˄130.14㸼⼎NIH˅ǃᄤ㔥˄.25㸼⼎NIHⱘ ೑ᆊ㥃⠽ᅲ偠ᅸ˅ˈҹঞ䖭ৄ䅵ㅫᴎ˄.1 ˅DŽ㱑✊䞛⫼᭄ᄫᓣⱘIPഄഔৃҹᐂࡽ䅵ㅫᴎᅮԡ ᭄᥂ˈԚ⫼᠋䆄ᖚ䍋ᴹै䴲ᐌೄ䲒ˈ᠔ҹIPഄഔ䗮ᐌ䛑᳝Ⳍᇍᑨⱘℷᓣඳৡ˄FQDN˅ˈ⬅ඳ ৡ᳡ࡵৄৢ೼఼ᇚ݊ࡼᗕ㗏䆥៤IPഄഔDŽಲࠄࠡ䴶NCBIⱘ՟ᄤˈ⫼᠋᳈ᜓᛣ⫼ ncbi.nlm.nih.gov㗠ϡᰃ130.14.25.1ᴹ䆓䯂NCBIⱘ䙷ৄ䅵ㅫᴎDŽᖙ乏⊼ᛣⱘᰃˈҢᎺ৥েIP ഄഔⱘᅮԡ㣗ೈ⬅໻ࠄᇣˈ㗠FQDNⱘᅮԡ㣗ೈ߭⬅ᇣࠄ໻DŽ಴ℸˈӏᛣᣛᅮⱘ䅵ㅫᴎⱘৡ⿄ 䛑ৃҹⳟ៤ᰃ݋᳝བϟⱘḐᓣ˖䅵ㅫᴎඳˈ݊Ё乊㑻ඳৡ˄FQDNЁ᳔ৢϔϾ⚍োৢ䴶ⱘ䚼 ߚ˅ߚЎ݁Ͼ໻㉏˄㾕㸼1.1˅DŽ೼㕢೑П໪ⱘ೑ᆊˈ乊㑻ඳৡ߭ᰃ⫼ϸϾᄫヺ㸼⼎ⱘ䅵ㅫᴎ ᠔೼೑ᆊ˄՟བˈ.ca㸼⼎ࡴᣓ໻ˈ.uk㸼⼎㘨ড়⥟೑˅DŽ 㸼1.1 乊㑻ඳৡ ᇍ಴⡍㔥㾘῵ े಴⡍㔥ⱘ៤ࡳ⿟ᑺ ⱘ᳔݋ԧᑺ䞣ˈህᰃ䅵ㅫ⠽⧚Ϟ᥹ܹ಴⡍㔥ⱘ䅵ㅫᴎⱘ ᭄䞣DŽ㔥㒰Wizards䗮䖛䖤㸠ϔϾ᥶⌟఼এሑৃ㛑ഄᇏᡒЏᴎˈᑊᡞ᥶⌟㒧ᵰ䖨ಲࠄ䖤㸠᥶⌟ ఼ⱘ䅵ㅫᴎϞˈҢ㗠ᅮᳳഄ䅵ㅫ䖭ѯ䅵ㅫᴎ˄៪Џᴎ˅ⱘ᭄䞣DŽЏᴎ᭄䞣ⱘ๲䭓䗳ᑺ䴲ᐌᰒ 㨫ˈ໻㑺↣12Ͼ᳜๲ࡴϔסˈⳂࠡЏᴎᘏ᭄Ꮖ㒣䍙䖛њ12,000,000ৄDŽ䖭ϔ๲䭓ⱘ㒱໻䚼ߚ ᴹ㞾ଚϮ䚼䮼ˈ՟བϛ㓈㔥ㄝᡩ䌘Ѣ᮹Ⲟ໻ӫ࣪ⱘᮄ໮ၦԧᑓਞϢ䗮䆃ᑇৄ˄೒1.1˅DŽ⬅Ѣ ৃ㛑᳝䆌໮᥶⌟఼ᡒϡࠄⱘЏᴎˈ䖭ϔ㒳䅵᭄ᄫⱘ㒱ᇍ᭄ⳂϡӮᕜ㊒⹂ˈᅗা䗖⫼Ѣ㗗ᆳ಴ ⡍㔥ⱘথሩ䍟࢓ˈҹঞ੠݊ᅗ᭄᥂䖯㸠↨䕗ⷨおDŽ՟བ˖᳝䆌໮䅵ㅫᴎ㹿䆒㕂೼䰆☿๭ৢ 䴶ˈߎѢᅝܼⱘ㗗㰥㗠䰏ℶњ݀ৌݙ䚼Ϣ໪䚼ⱘ䗮䆃˗݊ᅗϔѯ䅵ㅫᴎˈᇸ݊ᰃᆊ⫼䅵ㅫ ᴎˈা䗮䖛䇗ࠊ㾷䇗఼Ϣ಴⡍㔥ⷁ᱖Ⳍ䖲DŽ᠔ҹ᳔དᡞ㔥㒰Wizardⱘ᧰㋶㒧ᵰাⳟ៤ᰃҷ㸼 ㄀ϔゴ಴⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ1/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀ϔゴ಴⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有