第一章因特网与生物学家 页码,1/ Q 第一章因特网与生物学家 随着硏究者可用的序列与结枃信息的爆炸式增长,生物信息学领域,或更精确地说是计算生 物学领域,在基础生物医疗问题的研究中起着越来越大的作用。计算生物学家面临的挑战, 尤其是由人类基因组计划以及其它测序工作生成的大量数据带来的挑战,将对发现基因和设 计分子模型、定点突变,以及其它有可能发现基因与蛋白质的结构与功能的未知关系的实验 有所帮助。 在开始实际讨论解决生物问题的计算方法之前,必须先明确一个共同的背景,从而使用户可 以访问和使用本书中讨论的算法和工具。我们首先回顾了因特网及其有关术语,并讨论了四 种主要的因特网协议族,但不深入涉及协议的技术细节。关于这些协议的内部处理过程的详 细描述可以参考(Falk,1994:Kro,1994),这是给外行人看的好书。 因特网基础 尽管“因特网”听起来象一个单独的实体,但它实际上是一个网络的网络,由超过20,000个 分布在100多个国家中的相互连接的本地网或地区网构成。虽然有关远程通讯的工作在六十年 代初就已经开始,但因特网的真正起源还是1969年美国国防部远景研究规划局( Advanced Research Proj ects Agency,ARPA)的网络研究计划 ARPANET。 ARPANET最初连接了美国西海 岸的四个节点,其直接目的是在实验室之间传输有关国防的研究信息。随后又开展了一系列 的网络研究项目,并在10年后达到了另一个里程碑式的阶段。1981年引入的B|TNET( Because lt' s Time)在大学之间提供点对点的电子邮件和文件传输,1982年ARPA引入了传输控制协议 (TCP)以及因特网协议(IP),TCP/P使得不同的网络可以连接起来并进行通讯,从而形成 了现在的系统。很多文献详细介绍了因特网的发展历程和通讯协议,但大多数用户关心的只 是因特网在工作,而非具体的工作原理。 当网络中的计算机连接在一起的时候,需要有一种方法来明确表示每一台计算机,从而使消 息和文件真正找到它们的接收者。为此,所有与因特网直接相连的计算机都必须有一个|P地 址,IP地址是唯一的,标识且只能标识一台计算机。IP地址由四个以点号分隔的数字构成 如美国国立健康研究院(NH)生物技术信息中心(NCB)的主文件服务器的P地址是 130.14.25.1。从左到右这些数字表示的是:主域(130.14表示NH)、子网(.25表示NH的 国家药物实验室),以及这台计算机(.1)。虽然采用数字式的P地址可以帮助计算机定位 数据,但用户记忆起来却非常困难,所以P地址通常都有相对应的正式域名(FQDN),由域 名服务器在后台将其动态翻译成IP地址。回到前面NCB的例子,用户更愿意用 ncbi. nl m ni h.gov而不是130.1425.1来访问NCB的那台计算机。必须注意的是,从左向右P 地址的定位范围由大到小,而FQ叭N的定位范围则由小到大。因此,任意指定的计算机的名称 都可以看成是具有如下的格式:计算机.域,其中顶级域名(FODN中最后一个点号后面的部 分)分为六个大类(见表1.1)。在美国之外的国家,顶级域名则是用两个字符表示的计算机 所在国家(例如,Ca表示加拿大,,表示联合王国)。 表1.1顶级域名 对因特网规模(即因特网的成功程度)的最具体度量,就是计算物理上接入因特网的计算机的 数量。网络 zards通过运行一个探测器去尽可能地寻找主机,并把探测结果返回到运行探测 器的计算机上,从而定期地计算这些计算机(或主机)的数量。主机数量的增长速度非常显 著,大约每12个月增加一倍,目前主机总数已经超过了12,000,000台。这一增长的绝大部分 来自商业部门,例如万维网等投资于日益大众化的新多媒体广告与通讯平台(图1.1)。由于 可能有许多探测器找不到的主机,这一统计数字的绝对数目不会很精确,它只适用于考察因 特网的发展趋势,以及和其它数据进行比较研究。例如:有许多计算机被设置在防火墙后 面,出于安全的考虑而阻止了公司内部与外部的通讯;其它一些计算机,尤其是家用计算 机,只通过调制解调器与因特网短暂相连。所以最好把网络 Wi zard的搜索结果只看成是代表 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18
ϔゴ ⡍㔥Ϣ⫳⠽ᄺᆊ 䱣ⴔⷨお㗙ৃ⫼ⱘᑣ߫Ϣ㒧ᵘֵᙃⱘ⟚⚌ᓣ䭓ˈ⫳⠽ֵᙃᄺ乚ඳˈ㊒⹂ഄ䇈ᰃ䅵ㅫ⫳ ⠽ᄺ乚ඳˈ⸔⫳⠽ए⭫䯂乬ⱘⷨおЁ䍋ⴔ䍞ᴹ䍞ⱘ⫼DŽ䅵ㅫ⫳⠽ᄺᆊ䴶Јⱘᣥˈ ᇸ݊ᰃ⬅Ҏ㉏㒘䅵ߦҹঞ݊ᅗ⌟ᑣᎹ⫳៤ⱘ䞣᭄ᏺᴹⱘᣥˈᇚᇍথ⦄䆒 䅵ߚᄤൟǃᅮ⚍さবˈҹঞ݊ᅗ᳝ৃ㛑থ⦄Ϣ㲟ⱑ䋼ⱘ㒧ᵘϢࡳ㛑ⱘⶹ݇㋏ⱘᅲ偠 ᳝᠔ᐂࡽDŽ ᓔྟᅲ䰙䅼䆎㾷އ⫳⠽䯂乬ⱘ䅵ㅫᮍ⊩Пࠡˈᖙ乏ܜ⹂ᯢϔϾ݅ৠⱘ㚠᱃ˈҢ㗠Փ⫼᠋ৃ ҹ䆓䯂Փ⫼ᴀкЁ䅼䆎ⱘㅫ⊩ᎹDŽ៥Ӏ佪ܜಲ乒њ⡍㔥ঞ᳝݊݇ᴃ䇁ˈᑊ䅼䆎њಯ ⾡Џ㽕ⱘ⡍㔥ण䆂ᮣˈԚϡ⏅ܹ⍝ঞण䆂ⱘᡔᴃ㒚㡖DŽ݇Ѣ䖭ѯण䆂ⱘݙ䚼໘⧚䖛ⱘ䆺 㒚ᦣ䗄ৃҹখ㗗˄Falkˈ1994˗Krolˈ1994˅ˈ䖭ᰃ㒭㸠ҎⳟⱘདкDŽ ⡍㔥⸔ ሑㅵĀ⡍㔥ā䍋ᴹ䈵ϔϾऩ⣀ⱘᅲԧˈԚᅗᅲ䰙ϞᰃϔϾ㔥㒰ⱘ㔥㒰ˈ⬅䍙䖛20,000Ͼ ߚᏗ100ϾᆊЁⱘⳌѦ䖲ⱘᴀഄ㔥ഄऎ㔥ᵘ៤DŽ㱑✊᳝݇䖰䗮䆃ⱘᎹ݁कᑈ ҷ߱ህᏆ㒣ᓔྟˈԚ⡍㔥ⱘⳳℷ䍋⑤䖬ᰃ1969ᑈ㕢䰆䚼䖰᱃ⷨお㾘ߦሔ˄Advanced Research Projects AgencyˈARPA˅ⱘ㔥㒰ⷨお䅵ߦARPANETDŽARPANET᳔߱䖲њ㕢㽓⍋ ኌⱘಯϾ㡖⚍ˈ݊ⳈⳂⱘᰃᅲ偠ᅸП䯈Ӵ䕧᳝݇䰆ⱘⷨおֵᙃDŽ䱣ৢজᓔሩњϔ㋏߫ ⱘ㔥㒰ⷨお乍Ⳃˈᑊ10ᑈৢ䖒ࠄњϔϾ䞠ᓣⱘ䰊↉DŽ1981ᑈᓩܹⱘBITNET˄Because It's Time˅ᄺП䯈ᦤկ⚍ᇍ⚍ⱘ⬉ᄤ䚂ӊ᭛ӊӴ䕧ˈ1982ᑈARPAᓩܹњӴ䕧ࠊण䆂 ˄TCP˅ҹঞ⡍㔥ण䆂˄IP˅ˈTCP/IPՓᕫϡৠⱘ㔥㒰ৃҹ䖲䍋ᴹᑊ䖯㸠䗮䆃ˈҢ㗠ᔶ៤ њ⦄ⱘ㋏㒳DŽᕜ᭛⤂䆺㒚ҟ㒡њ⡍㔥ⱘথሩग़䗮䆃ण䆂ˈԚ᭄⫼᠋݇ᖗⱘা ᰃ⡍㔥Ꮉˈ㗠䴲ԧⱘᎹॳ⧚DŽ ᔧ㔥㒰Ёⱘ䅵ㅫᴎ䖲ϔ䍋ⱘᯊˈ䳔㽕᳝ϔ⾡ᮍ⊩ᴹᯢ⹂㸼⼎↣ϔৄ䅵ㅫᴎˈҢ㗠Փ⍜ ᙃ᭛ӊⳳℷᡒࠄᅗӀⱘᬊ㗙DŽЎℸˈ᠔᳝Ϣ⡍㔥ⳈⳌ䖲ⱘ䅵ㅫᴎ䛑ᖙ乏᳝ϔϾIPഄ ഔˈIPഄഔᰃଃϔⱘˈᷛ䆚Ϩা㛑ᷛ䆚ϔৄ䅵ㅫᴎDŽIPഄഔ⬅ಯϾҹ⚍োߚ䱨ⱘ᭄ᄫᵘ៤ˈ བ㕢ゟعᒋⷨお䰶˄NIH˅⫳⠽ᡔᴃֵᙃЁᖗ˄NCBI˅ⱘЏ᭛ӊ᳡ࡵ఼ⱘIPഄഔᰃ 130.14.25.1DŽҢᎺࠄে䖭ѯ᭄ᄫ㸼⼎ⱘᰃ˖Џඳ˄130.14㸼⼎NIH˅ǃᄤ㔥˄.25㸼⼎NIHⱘ ᆊ㥃⠽ᅲ偠ᅸ˅ˈҹঞ䖭ৄ䅵ㅫᴎ˄.1 ˅DŽ㱑✊䞛⫼᭄ᄫᓣⱘIPഄഔৃҹᐂࡽ䅵ㅫᴎᅮԡ ᭄ˈԚ⫼᠋䆄ᖚ䍋ᴹै䴲ᐌೄ䲒ˈ᠔ҹIPഄഔ䗮ᐌ䛑᳝Ⳍᇍᑨⱘℷᓣඳৡ˄FQDN˅ˈ⬅ඳ ৡ᳡ࡵৄৢ఼ᇚ݊ࡼᗕ㗏䆥៤IPഄഔDŽಲࠄࠡ䴶NCBIⱘ՟ᄤˈ⫼᠋ᜓᛣ⫼ ncbi.nlm.nih.gov㗠ϡᰃ130.14.25.1ᴹ䆓䯂NCBIⱘ䙷ৄ䅵ㅫᴎDŽᖙ乏⊼ᛣⱘᰃˈҢᎺেIP ഄഔⱘᅮԡ㣗ೈ⬅ࠄᇣˈ㗠FQDNⱘᅮԡ㣗ೈ߭⬅ᇣࠄDŽℸˈӏᛣᣛᅮⱘ䅵ㅫᴎⱘৡ⿄ 䛑ৃҹⳟ៤ᰃ᳝བϟⱘḐᓣ˖䅵ㅫᴎඳˈ݊Ё乊㑻ඳৡ˄FQDNЁ᳔ৢϔϾ⚍োৢ䴶ⱘ䚼 ߚ˅ߚЎ݁Ͼ㉏˄㾕㸼1.1˅DŽ㕢Пⱘᆊˈ乊㑻ඳৡ߭ᰃ⫼ϸϾᄫヺ㸼⼎ⱘ䅵ㅫᴎ ᠔ᆊ˄՟བˈ.ca㸼⼎ࡴᣓˈ.uk㸼⼎㘨ড়⥟˅DŽ 㸼1.1 乊㑻ඳৡ ᇍ⡍㔥㾘े⡍㔥ⱘ៤ࡳᑺⱘ᳔ԧᑺ䞣ˈህᰃ䅵ㅫ⠽⧚Ϟܹ⡍㔥ⱘ䅵ㅫᴎⱘ ᭄䞣DŽ㔥㒰Wizards䗮䖛䖤㸠ϔϾ⌟఼এሑৃ㛑ഄᇏᡒЏᴎˈᑊᡞ⌟㒧ᵰ䖨ಲࠄ䖤㸠⌟ ఼ⱘ䅵ㅫᴎϞˈҢ㗠ᅮᳳഄ䅵ㅫ䖭ѯ䅵ㅫᴎ˄Џᴎ˅ⱘ᭄䞣DŽЏᴎ᭄䞣ⱘ䭓䗳ᑺ䴲ᐌᰒ 㨫ˈ㑺↣12Ͼ᳜ࡴϔסˈⳂࠡЏᴎᘏ᭄Ꮖ㒣䍙䖛њ12,000,000ৄDŽ䖭ϔ䭓ⱘ㒱䚼ߚ ᴹ㞾ଚϮ䚼䮼ˈ՟བϛ㓈㔥ㄝᡩ䌘Ѣ᮹Ⲟӫ࣪ⱘᮄၦԧᑓਞϢ䗮䆃ᑇৄ˄1.1˅DŽ⬅Ѣ ৃ㛑᳝䆌⌟఼ᡒϡࠄⱘЏᴎˈ䖭ϔ㒳䅵᭄ᄫⱘ㒱ᇍ᭄ⳂϡӮᕜ㊒⹂ˈᅗা䗖⫼Ѣ㗗ᆳ ⡍㔥ⱘথሩ䍟ˈҹঞ݊ᅗ᭄䖯㸠↨䕗ⷨおDŽ՟བ˖᳝䆌䅵ㅫᴎ㹿䆒㕂䰆☿ৢ 䴶ˈߎѢᅝܼⱘ㗗㰥㗠䰏ℶњ݀ৌݙ䚼Ϣ䚼ⱘ䗮䆃˗݊ᅗϔѯ䅵ㅫᴎˈᇸ݊ᰃᆊ⫼䅵ㅫ ᴎˈা䗮䖛䇗ࠊ㾷䇗఼Ϣ⡍㔥ⷁ᱖Ⳍ䖲DŽ᠔ҹ᳔དᡞ㔥㒰Wizardⱘ᧰㋶㒧ᵰাⳟ៤ᰃҷ㸼 ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ1/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第一章因特网与生物学家 页码,2/ 某一时刻因特网的最小规模 与因特网连接 那些不能将他们的计算机通过以太网,10 Baset或类似方式连接到因特网的用户可以有两种主 要的方式访问网络:在线服务( Onl i ne Servi ce)或因特网提供商( I nternet ervi ce Provi der,1SP)。在线服务,例如美国在线(AOL)、 Compuserve以及 Prodi gy,提供了大量 的交互式数字服务,包括信息提取、电子邮件(E-mail)、公告牌,以及“聊天室”。在聊 天室里同时上线的用户可以就任何话题进行交流。虽然现在在线服务也可以访问万维网,但 大多数在这一系统中提供的信息服务依然是通过独占的、封闭的网络进行的。一旦在用户计 算机和在线服务器之间建立了连接,用户就可以不离开在线系统的主机而访问系统中特定的 信息资源。特定的内容可以包括从访问在线旅游预定系统到经常更新的大百科全书,这些项 目对于那些没有订购在线服务的用户是无法得到的。服务的内容随价格而异,大多数这些服 务都是按小时记费,即使正常的使用也可能会积累很高的费用。 因特网提供商采用相反的方式。ISP注重的不是提供内容,而是提供给用户必要的工具以发送 和接收邮件,上载和下载文件,以及浏览万维网,发现远程的信息。尽管象AT&T和MC|这样的 大公司占据了SP的主要角色,但不要求提供内容导致了家庭手工业式企业的快速发展,许多 小的本地公司也提供与因特网的可靠连接,位于马里兰州巴尔的摩郊外的 cl arkEt就是其中 之一。从一个500英亩农场的谷仓中的一组调制解调器开始, Cl arkEt现在无论从规模还是服 务质量上都已发展成为了这个国家最好的地区服务提供商之一。ISP的最大优势在于连接速 度,通常小的提供商可以提供比在线服务还快的连接速度。一般SP按月收费,可以无限使 用 现在在线服务与SP之间的界限已经逐渐模糊,并向在线服务倾斜。AoL最近更改了其收费策 略,变为按月而不是按小时收费。使得用户花费和大多数SP相等的开销,就可以得到全部 AOL的专有内容,以及通过SP所能得到的全部因特网工具。在美国的大多数州,AOL网络的密 集程度已经使得访问A0L变得象打本机电话一样方便,用户无论在哪里都可以方便地访问电子 邮件,这是本地小SP不能比拟的。象这样的发展趋势,加上本地电话和电缆公司也开始通过 新的高速光纤网提供访问因特网的服务,使得将来终端用户访问因特网将越来越便宜,而且 性能将越来越好。 电子邮件 许多用户是通过使用电子邮件(E-mail)认识因特网的。电子邮件是一个方便快捷的发送、 接收及回复消息的媒介,在许多地方实际上已成为不可或缺的工具。它的优势主要有: 比邮政服务快得多 传送消息比传统电话或面对面交谈要更为清晰明确。 接收者可以有很大的自由度来决定是马上回复、过一会回复还是根本不回复,从而更好 地控制自己的工作流程。 ·提供了一种方便的整理、保存消息的途径 ·发送电子邮件的成本很低,或根本不需花费。 虽然这些优势已经使得电子邮件成为了工业界和科学界一种十分重要的个人通讯手段,但用 户也必须清楚它的两个主要缺点。第一是安全性问题。邮件在传递到接收者的过程中,可能 经过一系列远程节点,在其中任何一处邮件都可能被有较高权限的人(例如系统管理员)所 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18
ᶤϔᯊࠏ⡍㔥ⱘ᳔ᇣ㾘DŽ Ϣ⡍㔥䖲 䙷ѯϡ㛑ᇚҪӀⱘ䅵ㅫᴎ䗮䖛ҹ㔥ˈ10BaseT㉏Ԑᮍᓣ䖲ࠄ⡍㔥ⱘ⫼᠋ৃҹ᳝ϸ⾡Џ 㽕ⱘᮍᓣ䆓䯂㔥㒰˖㒓᳡ࡵ˄Online Service˅⡍㔥ᦤկଚ(Internet Service Provider, ISP)DŽ㒓᳡ࡵˈ՟བ㕢㒓˄AOL˅ǃCompuserveҹঞProdigyˈᦤկњ䞣 ⱘѸѦᓣ᭄ᄫ᳡ࡵˈࣙᣀֵᙃᦤপǃ⬉ᄤ䚂ӊ˄E-mail˅ǃ݀ਞ⠠ˈҹঞĀ㘞ᅸāDŽ㘞 ᅸ䞠ৠᯊϞ㒓ⱘ⫼᠋ৃҹህӏԩ䆱乬䖯㸠Ѹ⌕DŽ㱑✊⦄㒓᳡ࡵгৃҹ䆓䯂ϛ㓈㔥ˈԚ ᭄䖭ϔ㋏㒳Ёᦤկⱘֵᙃ᳡ࡵձ✊ᰃ䗮䖛⣀ऴⱘǃᇕ䯁ⱘ㔥㒰䖯㸠ⱘDŽϔᮺ⫼᠋䅵 ㅫᴎ㒓᳡ࡵ఼П䯈ᓎゟњ䖲ˈ⫼᠋ህৃҹϡ⾏ᓔ㒓㋏㒳ⱘЏᴎ㗠䆓䯂㋏㒳Ё⡍ᅮⱘ ֵᙃ䌘⑤DŽ⡍ᅮⱘݙᆍৃҹࣙᣀҢ䆓䯂㒓ᮙ␌乘ᅮ㋏㒳ࠄ㒣ᐌᮄⱘⱒ⾥ܼкˈ䖭ѯ乍 ⳂᇍѢ䙷ѯ≵᳝䅶䌁㒓᳡ࡵⱘ⫼᠋ᰃ᮴⊩ᕫࠄⱘDŽ᳡ࡵⱘݙᆍ䱣ӋḐ㗠ᓖˈ᭄䖭ѯ᳡ ࡵ䛑ᰃᣝᇣᯊ䆄䌍ˈेՓℷᐌⱘՓ⫼гৃ㛑Ӯ⿃㌃ᕜ催ⱘ䌍⫼DŽ ⡍㔥ᦤկଚ䞛⫼ⳌডⱘᮍᓣDŽISP⊼䞡ⱘϡᰃᦤկݙᆍˈ㗠ᰃᦤկ㒭⫼᠋ᖙ㽕ⱘᎹҹথ䗕 ᬊ䚂ӊˈϞ䕑ϟ䕑᭛ӊˈҹঞ⌣㾜ϛ㓈㔥ˈথ⦄䖰ⱘֵᙃDŽሑㅵ䈵AT&TMCI䖭ḋⱘ ݀ৌऴњISPⱘЏ㽕㾦㡆ˈԚϡ㽕∖ᦤկݙᆍᇐ㟈њᆊᒁᎹϮᓣӕϮⱘᖿ䗳থሩˈ䆌 ᇣⱘᴀഄ݀ৌгᦤկϢ⡍㔥ⱘৃ䴴䖲ˈԡѢ偀䞠݄ᎲᏈᇨⱘᨽ䚞ⱘClarkNetህᰃ݊Ё ПϔDŽҢϔϾ500㣅ѽݰഎⱘ䈋ҧЁⱘϔ㒘䇗ࠊ㾷䇗఼ᓔྟˈClarkNet⦄᮴䆎Ң㾘䖬ᰃ᳡ ࡵ䋼䞣Ϟ䛑Ꮖথሩ៤Ўњ䖭Ͼᆊ᳔དⱘഄऎ᳡ࡵᦤկଚПϔDŽISPⱘ᳔ӬѢ䖲䗳 ᑺˈ䗮ᐌᇣⱘᦤկଚৃҹᦤկ↨㒓᳡ࡵ䖬ᖿⱘ䖲䗳ᑺDŽϔ㠀ISPᣝ᳜ᬊ䌍ˈৃҹ᮴䰤Փ ⫼DŽ ⦄㒓᳡ࡵϢISPП䯈ⱘ⬠䰤Ꮖ㒣䗤⏤㊞ˈᑊ㒓᳡ࡵ᭰ؒDŽAOL᳔䖥ᬍњ݊ᬊ䌍ㄪ ⬹ˈবЎᣝ᳜㗠ϡᰃᣝᇣᯊᬊ䌍DŽՓᕫ⫼᠋㢅䌍᭄ISPⳌㄝⱘᓔ䫔ˈህৃҹᕫࠄܼ䚼 AOLⱘϧ᳝ݙᆍˈҹঞ䗮䖛ISP᠔㛑ᕫࠄⱘܼ䚼⡍㔥ᎹDŽ㕢ⱘ᭄ᎲˈAOL㔥㒰ⱘᆚ 䲚ᑺᏆ㒣Փᕫ䆓䯂AOLবᕫ䈵ᠧᴀᴎ⬉䆱ϔḋᮍ֓ˈ⫼᠋᮴䆎ા䞠䛑ৃҹᮍ֓ഄ䆓䯂⬉ᄤ 䚂ӊˈ䖭ᰃᴀഄᇣISPϡ㛑↨ᢳⱘDŽ䈵䖭ḋⱘথሩ䍟ˈࡴϞᴀഄ⬉䆱⬉㓚݀ৌгᓔྟ䗮䖛 ᮄⱘ催䗳ܝ㑸㔥ᦤկ䆓䯂⡍㔥ⱘ᳡ࡵˈՓᕫᇚᴹ㒜ッ⫼᠋䆓䯂⡍㔥ᇚ䍞ᴹ䍞֓ᅰˈ㗠Ϩ ᗻ㛑ᇚ䍞ᴹ䍞དDŽ ⬉ᄤ䚂ӊ 䆌⫼᠋ᰃ䗮䖛Փ⫼⬉ᄤ䚂ӊ˄E-mail˅䅸䆚⡍㔥ⱘDŽ⬉ᄤ䚂ӊᰃϔϾᮍ֓ᖿ᥋ⱘথ䗕ǃ ᬊঞಲ⍜ᙃⱘၦҟˈ䆌ഄᮍᅲ䰙ϞᏆ៤Ўϡৃ㔎ⱘᎹDŽᅗⱘӬЏ㽕᳝˖ z ↨䚂ᬓ᳡ࡵᖿᕫDŽ z Ӵ䗕⍜ᙃ↨Ӵ㒳⬉䆱䴶ᇍ䴶Ѹ䇜㽕Ў⏙᱄ᯢ⹂DŽ z ᬊ㗙ৃҹ᳝ᕜⱘ㞾⬅ᑺᴹއᅮᰃ偀Ϟಲǃ䖛ϔӮಲ䖬ᰃḍᴀϡಲˈҢ㗠ད ഄࠊ㞾ᏅⱘᎹ⌕DŽ z ᦤկњϔ⾡ᮍ֓ⱘᭈ⧚ǃֱᄬ⍜ᙃⱘ䗨ᕘDŽ z থ䗕⬉ᄤ䚂ӊⱘ៤ᴀᕜԢˈḍᴀϡ䳔㢅䌍DŽ 㱑✊䖭ѯӬᏆ㒣Փᕫ⬉ᄤ䚂ӊ៤ЎњᎹϮ⬠⾥ᄺ⬠ϔ⾡कߚ䞡㽕ⱘϾҎ䗮䆃↉ˈԚ⫼ ᠋гᖙ乏⏙ἮᅗⱘϸϾЏ㽕㔎⚍DŽϔᰃᅝܼᗻ䯂乬DŽ䚂ӊӴ䗦ࠄᬊ㗙ⱘ䖛Ёˈৃ㛑 㒣䖛ϔ㋏߫䖰㡖⚍ˈ݊Ёӏԩϔ໘䚂ӊ䛑ৃ㛑㹿᳝䕗催ᴗ䰤ⱘҎ˄՟བ㋏㒳ㅵ⧚ਬ˅᠔ ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ2/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第一章因特网与生物学家 页码,3/ 截取和阅读。第二是保密问题。在工业界中,电子邮件通常被认为是只用于办公室通讯的公 司财产,因此就必须在管理者的监控之下。而在学院、准学院及研究领域则相反。例如,NH 鼓励个人在公布的准则范围内使用电子邮件,这里的关键是“公布的准则”。无论在什么情 况下,电子邮件系统的用户都应该了解本机构的电子邮件使用规则,从而正确有效地使用这 工具。我们强烈推荐一本关于如何有效使用电子邮件的杰出指南。( 1995) 发送电子邮件 电子邮件地址的格式一般为:用户@计算机.域。其中“用户”是个人用户名,“计算机.域” 指向电子邮件帐号所在的计算机。和普通邮件一样,电子邮件消息包括“信封”(或称为 “信头”)和“正文”。信头的内容包括:收发信人的地址、电子邮件主题行、以及邮件如 何从发信人到收信人的信息。信头下面是真正的消息(或“正文”),如同普通信件信封里 的内容一样。图1.2显示了一个电子邮件消息的全部组成部分 电子邮件程序千变万化,随使用平台以及用户的需求而不同。通常局域网的属性决定了可以 使用哪些邮件程序,而且这一决定往往是由系统管理员而非个人用户做出的。最广泛使用的 带有图形用户界面的电子邮件软件包有:用于 Maci nash的 Eudora和用于MaC、 Wi ndows和UNX 平台的 Mi crosoft Exchange。基于文本的电子邮件程序有Elm和Pine,这通常需要注册到UNX 帐号来使用 新闻组 在图1.2的例子中,电子邮件被发给一个单独的收信人。电子邮件系统的一大优点就是可以把 封电子邮件发给很多人。可以通过使用“别名”来实现这一目的。用户可以在邮件程序中 定义一组人,并给这个组一个名字(“别名”)。用户把电子邮件发给这个别名后,邮件程 序就会自动地把消息广播给组中的每个人,而不是逐一发送。即使在小规模组中设立别名也 可以节省大量时间。这样也可以保证组中的每个人都能真正接收到发到组里的每一封信 新闻组”则是广播电子邮件消息的另一种方法。和“别名”方法不同的是,订阅新闻组时 电子邮件地址列表由远端计算机编排维护,就象杂志维护一份订阅者名单一样。例如 Bl0SCI新闻组是流通量最大的新闻组之一,提供了一个在相当大的生物学主题范围内讨论和 交换思想的论坛。要开始接收发表在Bl0SC的自动测序讨论组的邮件,用户需要发送一个消 息给biosci-server@net.bio.net,并在正文中写上subscribeautoseq。新闻组中的全部文 章就会发送到新的订户手中,该用户就可以参与讨论了。用户想要退出新闻组时,只需要给 相同地址发送消息 unsubscri be autoseq就可以了。要得到包括的讨论组完整列表在内的 BI0SCI的更多信息,给 bi osci- serverenet.bio.net发一封邮件,清空邮件主题行,并在消息 正文中写上 i nfo faq。B|0SC服务器会发送一份常见问题表作为回复,其内容包含了B|0SC 管理下的每个新闻组的详细信息。 就象邮政信件一样,电子邮件中最近也有一股“垃圾邮件”的浪潮,这些邮件来自某些公司 出于商业宣传的目的而编排的大量邮件地址列表。大多数这样的列表都是从联机注册或相似 渠道得来的,所以避开这种邮件列表的最好办法就是有选择地给出你的电子邮件地址。大多 数新闻组的电子邮件地址是保密的,如果你有疑问的话,不妨先询问一下 电子邮件服务器 无论接收者是一个还是很多,到此为止的讨论仅限于发送消息。电子邮件还可以用于从生物 数据库中进行预测或读取记录。用户可以用电子邮件给远端的服务器发送消息,以预先定义 的格式说明希望进行的操作,服务器就会执行这些操作,并将结果用电子邮件返回给用 图1.2显示的是电子邮件査询结果的示例,其中服务器是NCB的查询电子邮件服务器。虽然这 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18
প䯙䇏DŽѠᰃֱᆚ䯂乬DŽᎹϮ⬠Ёˈ⬉ᄤ䚂ӊ䗮ᐌ㹿䅸Ўᰃা⫼Ѣࡲ݀ᅸ䗮䆃ⱘ݀ ৌ䋶ѻˈℸህᖙ乏ㅵ⧚㗙ⱘⲥПϟDŽ㗠ᄺ䰶ǃޚᄺ䰶ঞⷨお乚ඳ߭ⳌডDŽ՟བˈNIH 哧ࢅϾҎ݀Ꮧⱘޚ߭㣗ೈݙՓ⫼⬉ᄤ䚂ӊˈ䖭䞠ⱘ݇䬂ᰃĀ݀Ꮧⱘޚ߭āDŽ᮴䆎ҔМᚙ މϟˈ⬉ᄤ䚂ӊ㋏㒳ⱘ⫼᠋䛑ᑨ䆹њ㾷ᴀᴎᵘⱘ⬉ᄤ䚂ӊՓ⫼㾘߭ˈҢ㗠ℷ⹂᳝ᬜഄՓ⫼䖭 ϔᎹDŽ៥Ӏᔎ⚜㤤ϔᴀ݇Ѣབԩ᳝ᬜՓ⫼⬉ᄤ䚂ӊⱘᵄߎᣛफDŽ˄Lamb and Peek, 1995˅ থ䗕⬉ᄤ䚂ӊ ⬉ᄤ䚂ӊഄഔⱘḐᓣϔ㠀Ў˖⫼᠋#䅵ㅫᴎඳDŽ݊ЁĀ⫼᠋āᰃϾҎ⫼᠋ৡˈĀ䅵ㅫᴎඳ” ᣛ⬉ᄤ䚂ӊᏤো᠔ⱘ䅵ㅫᴎDŽ᱂䗮䚂ӊϔḋˈ⬉ᄤ䚂ӊ⍜ᙃࣙᣀĀֵᇕā˄⿄Ў Āֵ༈ā˅Āℷ᭛āDŽֵ༈ⱘݙᆍࣙᣀ˖ᬊথֵҎⱘഄഔǃ⬉ᄤ䚂ӊЏ乬㸠ǃҹঞ䚂ӊབ ԩҢথֵҎࠄᬊֵҎⱘֵᙃDŽֵ༈ϟ䴶ᰃⳳℷⱘ⍜ᙃ˄Āℷ᭛ā˅ˈབৠ᱂䗮ֵӊֵᇕ䞠 ⱘݙᆍϔḋDŽ1.2ᰒ⼎њϔϾ⬉ᄤ䚂ӊ⍜ᙃⱘܼ䚼㒘៤䚼ߚDŽ ⬉ᄤ䚂ӊᑣगবϛ࣪ˈ䱣Փ⫼ᑇৄҹঞ⫼᠋ⱘ䳔∖㗠ϡৠDŽ䗮ᐌሔඳ㔥ⱘሲᗻއᅮњৃҹ Փ⫼ાѯ䚂ӊᑣˈ㗠Ϩ䖭ϔއᅮᕔᕔᰃ⬅㋏㒳ㅵ⧚ਬ㗠䴲ϾҎ⫼᠋ߎخⱘDŽ᳔ᑓ⊯Փ⫼ⱘ ᏺ᳝ᔶ⫼᠋⬠䴶ⱘ⬉ᄤ䚂ӊ䕃ӊࣙ⫼˖᳝ѢMacintashⱘEudora⫼ѢMacǃWindowsUNIX ᑇৄⱘMicrosoft ExchangeDŽѢ᭛ᴀⱘ⬉ᄤ䚂ӊᑣ᳝ElmPineˈ䖭䗮ᐌ䳔㽕⊼ࠄݠUNIX ᏤোᴹՓ⫼DŽ ᮄ䯏㒘 1.2ⱘ՟ᄤЁˈ⬉ᄤ䚂ӊ㹿থ㒭ϔϾऩ⣀ⱘᬊֵҎDŽ⬉ᄤ䚂ӊ㋏㒳ⱘϔӬ⚍ህᰃৃҹᡞ ϔᇕ⬉ᄤ䚂ӊথ㒭ᕜҎDŽৃҹ䗮䖛Փ⫼Ā߿ৡāᴹᅲ⦄䖭ϔⳂⱘDŽ⫼᠋ৃҹ䚂ӊᑣЁ ᅮНϔ㒘Ҏˈᑊ㒭䖭Ͼ㒘ϔϾৡᄫ˄Ā߿ৡā˅DŽ⫼᠋ᡞ⬉ᄤ䚂ӊথ㒭䖭Ͼ߿ৡৢˈ䚂ӊ ᑣህӮ㞾ࡼഄᡞ⍜ᙃᑓ᪁㒭㒘Ёⱘ↣ϾҎˈ㗠ϡᰃ䗤ϔথ䗕DŽेՓᇣ㾘㒘Ё䆒ゟ߿ৡг ৃҹ㡖ⳕ䞣ᯊ䯈DŽ䖭ḋгৃҹֱ䆕㒘Ёⱘ↣ϾҎ䛑㛑ⳳℷᬊࠄথࠄ㒘䞠ⱘ↣ϔᇕֵDŽ Āᮄ䯏㒘ā߭ᰃᑓ᪁⬉ᄤ䚂ӊ⍜ᙃⱘϔ⾡ᮍ⊩DŽĀ߿ৡāᮍ⊩ϡৠⱘᰃˈ䅶䯙ᮄ䯏㒘ᯊ ⬉ᄤ䚂ӊഄഔ߫㸼⬅䖰ッ䅵ㅫᴎ㓪ᥦ㓈ᡸˈህ䈵ᴖᖫ㓈ᡸϔӑ䅶䯙㗙ৡऩϔḋDŽ՟བˈ BIOSCIᮄ䯏㒘ᰃ⌕䗮䞣᳔ⱘᮄ䯏㒘ПϔˈᦤկњϔϾⳌᔧⱘ⫳⠽ᄺЏ乬㣗ೈݙ䅼䆎 Ѹᤶᗱᛇⱘ䆎യDŽ㽕ᓔྟᬊথ㸼BIOSCIⱘ㞾ࡼ⌟ᑣ䅼䆎㒘ⱘ䚂ӊˈ⫼᠋䳔㽕থ䗕ϔϾ⍜ ᙃ㒭biosci-server@net.bio.netˈᑊℷ᭛ЁݭϞsubscribe autoseqDŽᮄ䯏㒘Ёⱘܼ䚼᭛ ゴህӮথ䗕ࠄᮄⱘ䅶᠋Ёˈ䆹⫼᠋ህৃҹখϢ䅼䆎њDŽ⫼᠋ᛇ㽕䗔ߎᮄ䯏㒘ᯊˈা䳔㽕㒭 Ⳍৠഄഔথ䗕⍜ᙃunsubscribe autoseqህৃҹњDŽ㽕ᕫࣙࠄᣀⱘ䅼䆎㒘ᅠᭈ߫㸼ݙⱘ BIOSCIⱘֵᙃˈ㒭biosci-server@net.bio.netথϔᇕ䚂ӊˈ⏙ぎ䚂ӊЏ乬㸠ˈᑊ⍜ᙃ ℷ᭛ЁݭϞinfo faqDŽBIOSCI᳡ࡵ఼Ӯথ䗕ϔӑᐌ㾕䯂乬㸼Ўಲˈ݊ݙᆍࣙњBIOSCI ㅵ⧚ϟⱘ↣Ͼᮄ䯏㒘ⱘ䆺㒚ֵᙃDŽ ህ䈵䚂ᬓֵӊϔḋˈ⬉ᄤ䚂ӊЁ᳔䖥г᳝ϔ㙵Āൗഒ䚂ӊāⱘ⌾╂ˈ䖭ѯ䚂ӊᴹ㞾ᶤѯ݀ৌ ߎѢଚϮᅷӴⱘⳂⱘ㗠㓪ᥦⱘ䞣䚂ӊഄഔ߫㸼DŽ᭄䖭ḋⱘ߫㸼䛑ᰃҢ㘨ᴎ⊼ݠⳌԐ ⏴䘧ᕫᴹⱘˈ᠔ҹ䙓ᓔ䖭⾡䚂ӊ߫㸼ⱘ᳔དࡲ⫣ህᰃ᳝䗝ᢽഄ㒭ߎԴⱘ⬉ᄤ䚂ӊഄഔDŽ ᭄ᮄ䯏㒘ⱘ⬉ᄤ䚂ӊഄഔᰃֱᆚⱘˈབᵰԴ᳝⭥䯂ⱘ䆱ˈϡོܜ䆶䯂ϔϟDŽ ఼ࡵᄤ䚂ӊ᳡⬉ ᮴䆎ᬊ㗙ᰃϔϾ䖬ᰃᕜˈࠄℸЎℶⱘ䅼䆎ҙ䰤Ѣথ䗕⍜ᙃDŽ⬉ᄤ䚂ӊ䖬ৃҹ⫼ѢҢ⫳⠽ ᭄ᑧЁ䖯㸠乘⌟䇏প䆄ᔩDŽ⫼᠋ৃҹ⫼⬉ᄤ䚂ӊ㒭䖰ッⱘ᳡ࡵ఼থ䗕⍜ᙃˈҹ乘ܜᅮН ⱘḐᓣ䇈ᯢᏠᳯ䖯㸠ⱘ᪡ˈ᳡ࡵ఼ህӮᠻ㸠䖭ѯ᪡ˈᑊᇚ㒧ᵰ⫼⬉ᄤ䚂ӊ䖨ಲ㒭⫼᠋DŽ 1.2ᰒ⼎ⱘᰃ⬉ᄤ䚂ӊᶹ䆶㒧ᵰⱘ⼎՟ˈ݊Ё᳡ࡵ఼ᰃNCBIⱘᶹ䆶⬉ᄤ䚂ӊ᳡ࡵ఼DŽ㱑✊䖭 ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ3/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第一章因特网与生物学家 页码,4/ 神方式不是交互式的,但它将硬件维护和软件升级的工作交给了维护服务器的管理员,使用 户更专心于结果而非程序本身。后面章节中将有一些电子邮件服务器的详细论述。日内瓦大 学的 Amos Bai roch维护着一个优秀的最新电子邮件服务器列表,此列表可以通过匿名文件传 输协议(下文介绍)的方式得到。具体做法是:访问 expasy. huge.Ch站点,进 入/ database/info目录,下载文件 serv ema.txt。对于大多数这样的服务器,给服务器的电 子邮件地址发送一个help消息就可以得到服务器的详细指令集,其中包括查询的正确格式 文件传输协议 虽然电子邮件传送消息存在很多优点,有经验的用户在传输附加文件时都曾遇到麻烦。问题 在于仅仅将文件附加在邮件上并发送出去,并不意味着接收者能真正得到、解码并使用这个 文件。虽然已经开发了许多跨平台电子邮件软件(例如 Mi crosoft EXchange),但不同地点 的人使用不同的电子邮件软件使得通过邮件发送文件并非有效、安全的方法,至少在近期内 如此。对此问题的解决方法之一是使用文件传输协议(FTP)。FTP的使用十分简单,在用户 计算机(客户)和远端服务器之间建立起连接,并在整个FTP任务过程中保持连接。文件的传 输速度很快,大约每秒5-10千字节。这一速度随一天中的不同时间、客户与服务器之间的距 离,以及网络流通量不同而有所变化 为了建立FTP连接并传输文件,用户必须在远端服务器上有帐号。科硏界免费提供了许多文件 和程序,访问这些文件并不要求拥有这些程序所在的机器上的帐号,而是用一种称为匿名FTP 的系统建立连接。在这个系统下,用户与远端服务器连接时并不输入用户名/口令,而是在用 户名中输入“ anonymous”,在口令中输入个人电子邮件地址。服务器系统管理员用这些电子 邮件地址进行访问统计,这可能会对那些提供文件和程序的人有所帮助。一个UNX名FTP对 话的例子如图1.3所示。 虽然FTP实际上是在UNX环境中产生的,但 Maci tosh和PC用户也可以用基于图形用户界面 (GUI)的程序浏览FTP服务器上的UNX目录。用户不需要了解UNX指令就可以下载文件,他 们可以从弹出式菜单上选取,或在UNX文件结构中用鼠标移动和点击选取要下载的文件 Fetch是 Maci tosh上最流行的FTP程序,图1.4给出了 Fetch窗口的一个例子,图中显示了基于 图形用户界面的程序和图1.3所示的UNX下FTP的区别。 Amos Bai roch同样也维护了一份详细 的分子生物学FTP服务器的列表,此列表可以从 expacy. houge.Ch获得,具体方法为:进 入/ database/info目录,下载 serv_ftp.txt文件。 GOPHER FTP用户进入一个特定的目录后,只能看到当前目录下的子目录和文件的名称。要想真正看到 文件的内容,用户必须把文件下载到本地计算机。为了节省时间,明尼苏达大学的研究者开 发了一个系统,使得不必下载就能阅读文本文件。这一程序按照学校的吉祥物被命名为 Gopher,这也是分布式文档发送系统这一类特殊的交互式客户-服务器程序的最早的实例之 opher很容易使用,它不要求用户知道所寻找信息的物理位置或地址。所有不同 Gopher站点 存贮的信息都以一个固定的层次结构组织起来,用户用鼠标点击就可以浏览这一切。同样用 鼠标点击的方法用户还可以在互连的 Gopher站点(称作 Gopher hol es)中从一个站点转到另 一个站点。 Maci tosh上的主要 Gopher浏览程序叫做 Turbo Gopher,如图1.5所示 万维网 尽管 Gopher解决了很多信息传输的问题,但只能用于发布文本。 Gopher还从概念上启发了 个重要的思想,从而导致了下一代可以传送图象、声音以及影象的文档传送系统的开发。欧 洲原子能研究委员会1989年开始的研究提供了万维网的基础,从此一种新的可以处理多种非 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18
⾡ᮍᓣϡᰃѸѦᓣⱘˈԚᅗᇚ⹀ӊ㓈ᡸ䕃ӊछ㑻ⱘᎹѸ㒭њ㓈ᡸ᳡ࡵ఼ⱘㅵ⧚ਬˈՓ⫼ ᠋ϧᖗѢ㒧ᵰ㗠䴲ᑣᴀ䑿DŽৢ䴶ゴ㡖Ёᇚ᳝ϔѯ⬉ᄤ䚂ӊ᳡ࡵ఼ⱘ䆺㒚䆎䗄DŽ᮹ݙ⪺ ᄺⱘAmos Bairoch㓈ᡸⴔϔϾӬ⾔ⱘ᳔ᮄ⬉ᄤ䚂ӊ᳡ࡵ఼߫㸼ˈℸ߫㸼ৃҹ䗮䖛ओৡ᭛ӊӴ 䕧ण䆂˄ϟ᭛ҟ㒡˅ⱘᮍᓣᕫࠄDŽԧخ⫣ᰃ˖䆓䯂expasy.hcuge.chキ⚍ˈ䖯 ܹ/database/infoⳂᔩˈϟ䕑᭛ӊserv_ema.txtDŽᇍѢ᭄䖭ḋⱘ᳡ࡵˈ఼㒭᳡ࡵ఼ⱘ⬉ ᄤ䚂ӊഄഔথ䗕ϔϾhelp⍜ᙃህৃҹᕫࠄ᳡ࡵ఼ⱘ䆺㒚ᣛҸ䲚ˈ݊Ёࣙᣀᶹ䆶ⱘℷ⹂ḐᓣDŽ ᭛ӊӴ䕧ण䆂 㱑✊⬉ᄤ䚂ӊӴ䗕⍜ᙃᄬᕜӬ⚍ˈ᳝㒣偠ⱘ⫼᠋Ӵ䕧䰘ࡴ᭛ӊᯊ䛑᳒䘛ࠄ咏⚺DŽ䯂乬 Ѣҙҙᇚ᭛ӊ䰘ࡴ䚂ӊϞᑊথ䗕ߎএˈᑊϡᛣੇⴔᬊ㗙㛑ⳳℷᕫࠄǃ㾷ⷕᑊՓ⫼䖭Ͼ ᭛ӊDŽ㱑✊Ꮖ㒣ᓔথњ䆌䎼ᑇৄ⬉ᄤ䚂ӊ䕃ӊ˄՟བMicrosoft Exchange˅ˈԚϡৠഄ⚍ ⱘҎՓ⫼ϡৠⱘ⬉ᄤ䚂ӊ䕃ӊՓᕫ䗮䖛䚂ӊথ䗕᭛ӊᑊ䴲᳝ᬜǃᅝܼⱘᮍ⊩ˈ㟇ᇥ䖥ᳳݙ བℸDŽᇍℸ䯂乬ⱘ㾷އᮍ⊩ПϔᰃՓ⫼᭛ӊӴ䕧ण䆂˄FTP˅DŽFTPⱘՓ⫼कߚㅔऩˈ⫼᠋ 䅵ㅫᴎ˄ᅶ᠋˅䖰ッ᳡ࡵ఼П䯈ᓎゟ䍋䖲ˈᑊᭈϾFTPӏࡵ䖛Ёֱᣕ䖲DŽ᭛ӊⱘӴ 䕧䗳ᑺᕜᖿˈ㑺↣⾦5~10गᄫ㡖DŽ䖭ϔ䗳ᑺ䱣ϔЁⱘϡৠᯊ䯈ǃᅶ᠋Ϣ᳡ࡵ఼П䯈ⱘ䎱 ⾏ˈҹঞ㔥㒰⌕䗮䞣ϡৠ㗠᳝᠔ব࣪DŽ ЎњᓎゟFTP䖲ᑊӴ䕧᭛ӊˈ⫼᠋ᖙ乏䖰ッ᳡ࡵ఼Ϟ᳝ᏤোDŽ⾥ⷨ⬠ܡ䌍ᦤկњ䆌᭛ӊ ᑣˈ䆓䯂䖭ѯ᭛ӊᑊϡ㽕∖ᢹ᳝䖭ѯᑣ᠔ⱘᴎ఼ϞⱘᏤোˈ㗠ᰃ⫼ϔ⾡⿄ЎओৡFTP ⱘ㋏㒳ᓎゟ䖲DŽ䖭Ͼ㋏㒳ϟˈ⫼᠋Ϣ䖰ッ᳡ࡵ఼䖲ᯊᑊϡ䕧ܹ⫼᠋ৡষҸˈ㗠ᰃ⫼ ᠋ৡЁ䕧ܹ“anonymous”ˈষҸЁ䕧ܹϾҎ⬉ᄤ䚂ӊഄഔDŽ᳡ࡵLTD఼㒳ㅵ⧚ਬ⫼䖭ѯ⬉ᄤ 䚂ӊഄഔ䖯㸠䆓䯂㒳䅵ˈ䖭ৃ㛑Ӯᇍ䙷ѯᦤկ᭛ӊᑣⱘҎ᳝᠔ᐂࡽDŽϔϾUNIXओৡFTPᇍ 䆱ⱘ՟ᄤབ1.3᠔⼎DŽ 㱑✊FTPᅲ䰙ϞᰃUNIX⦃๗Ёѻ⫳ⱘˈԚMacintoshPC⫼᠋гৃҹ⫼Ѣᔶ⫼᠋⬠䴶 ˄GUI˅ⱘᑣ⌣㾜FTP᳡ࡵ఼ϞⱘUNIXⳂᔩDŽ⫼᠋ϡ䳔㽕њ㾷UNIXᣛҸህৃҹϟ䕑᭛ӊˈҪ ӀৃҹҢᔍߎᓣ㦰ऩϞ䗝পˈUNIX᭛ӊ㒧ᵘЁ⫼哴ᷛ⿏ࡼ⚍ߏ䗝প㽕ϟ䕑ⱘ᭛ӊDŽ FetchᰃMacintoshϞ᳔⌕㸠ⱘFTPᑣˈ1.4㒭ߎњFetchにষⱘϔϾ՟ᄤˈЁᰒ⼎њѢ ᔶ⫼᠋⬠䴶ⱘᑣ1.3᠔⼎ⱘUNIXϟFTPⱘऎ߿DŽAmos Bairochৠḋг㓈ᡸњϔӑ䆺㒚 ⱘߚᄤ⫳⠽ᄺFTP᳡ࡵ఼ⱘ߫㸼ˈℸ߫㸼ৃҹҢexpacy.houge.ch㦋ᕫˈԧᮍ⊩Ў˖䖯 ܹ/database/infoⳂᔩˈϟ䕑serv_ftp.txt᭛ӊDŽ GOPHER FTP⫼᠋䖯ܹϔϾ⡍ᅮⱘⳂᔩৢˈা㛑ⳟࠄᔧࠡⳂᔩϟⱘᄤⳂᔩ᭛ӊⱘৡ⿄DŽ㽕ᛇⳳℷⳟࠄ ᭛ӊⱘݙᆍˈ⫼᠋ᖙ乏ᡞ᭛ӊϟ䕑ࠄᴀഄ䅵ㅫᴎDŽЎњ㡖ⳕᯊ䯈ˈᯢሐ㢣䖒ᄺⱘⷨお㗙ᓔ থњϔϾ㋏㒳ˈՓᕫϡᖙϟ䕑ህ㛑䯙䇏᭛ᴀ᭛ӊDŽ䖭ϔᑣᣝ✻ᄺ᷵ⱘঢ়⼹⠽㹿ੑৡЎ Gopherˈ䖭гᰃߚᏗᓣ᭛ḷথ䗕㋏㒳䖭ϔ㉏⡍⅞ⱘѸѦᓣᅶ᠋᳡ࡵ఼ᑣⱘ᳔ᮽⱘᅲ՟П ϔDŽ GopherᕜᆍᯧՓ⫼ˈᅗϡ㽕∖⫼᠋ⶹ䘧᠔ᇏᡒֵᙃⱘ⠽⧚ԡ㕂ഄഔDŽ᠔᳝ϡৠGopherキ⚍ ᄬ䌂ⱘֵᙃ䛑ҹϔϾᅮⱘሖ㒧ᵘ㒘㒛䍋ᴹˈ⫼᠋⫼哴ᷛ⚍ߏህৃҹ⌣㾜䖭ϔߛDŽৠḋ⫼ 哴ᷛ⚍ߏⱘᮍ⊩⫼᠋䖬ৃҹѦ䖲ⱘGopherキ⚍˄⿄Gopher holes˅ЁҢϔϾキ⚍䕀ࠄ ϔϾキ⚍DŽMacintoshϞⱘЏ㽕Gopher⌣㾜ᑣিخTurbo Gopherˈབ1.5᠔⼎DŽ ϛ㓈㔥 ሑㅵGopher㾷އњᕜֵᙃӴ䕧ⱘ䯂乬ˈԚা㛑⫼ѢথᏗ᭛ᴀDŽGopher䖬ҢὖᗉϞਃথњϔ Ͼ䞡㽕ⱘᗱᛇˈҢ㗠ᇐ㟈њϟϔҷৃҹӴ䗕䈵ǃໄ䷇ҹঞᕅ䈵ⱘ᭛ḷӴ䗕㋏㒳ⱘᓔথDŽ ⌆ॳᄤ㛑ⷨおྨਬӮ1989ᑈᓔྟⱘⷨおᦤկњϛ㓈㔥ⱘ⸔ˈҢℸϔ⾡ᮄⱘৃҹ໘⧚⾡䴲 ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ4/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第一章因特网与生物学家 页码,5/ 文本材料的媒体诞生了 漫游 和 Gopher相比,在网页中漫游不需要用户知道有关所査找信息的详细地址。只要单击特定的 文本、按钮或图片就可以进行漫游,这些可点击的元素总称为超文本链接。一旦点击了一个 超文本链接,用户就会被带到其它的网点。与 Gopher不同的是,这个新的地点不一定是一个 层次结构的上一个或下一个地点,超文本链接可以将用户带到同一个网站的其它地方或世界 另一边的网点。WEB上的每一个文档称作一个网页,一个专门的服务器上的所有网页总称为 个网站。严格地用超文本链接进行漫游也被称为WEB冲浪 用户可以通过键入地址来更为直接的找到信息。WEB的一大特点就是:用户用来浏览网页的程 序(浏览器)也可以同样的用于访问 Gopher和FTP站点,从而在一定程度上避免了对专门的 Gopher和FTP应用程序的需求。为此引入了一个统一的命名规则,它不仅可以告诉浏览器远距 离站点的位置,更为重要的是可以告诉浏览器远距离站点信息的类型,使得浏览器可以正确 显示。这种标准格式的地址就称为统一资源定位器(简称URL),其一般格式为:协议://计 算机.域。其中协议表示站点的类型,计算机.域表示站点的位置(见表1.2)。网站URL中的 http代表超文本传输协议,是主机向客户传送网络文件的方法之 浏览器之战 浏览网页的浏览器是连接远距离站点的客户服务器应用程序,它从所连接的站点中下载用户 请求的信息,并显示在用户监视器上,然后断开连接。从远距离主机上所获得的信息以一种 与平台无关的格式存在,这种格式称为超文本标识语言(简称HTML)。HML代码是纯文本代 码,文档中所有的图形和声音都以单独的、通用的文件格式存在(例如:图形以GlF格式保存 和传送,GF是 CompuServe开发的用于快速有效地传送图形的格式)。正因为如此,浏览器才 可以显示任何类型( Maci tosh、PC或NIX)计算机上的所有网页。浏览器总是先显示网页的 文本内容,然后再显示正在下载的页面的其它内容。只要这些平台使用的是同一个公司的浏 览器,同样的网页就会以大体相同的模样显示,很少有例外。 “浏览器之战”的主角是网景公司的航海家( Navi gator),目前占据了大约80%的浏览器市 场。网景是 Marc Andreesen和其同事开发出来的,它是 NCSA Tel net(第一个被广泛使用的网 络浏览器)的派生产品。网景开发队伍中的大多数人来自NCSA,他们在意识到开发WB技术的 重要商业意义之后离开了NCSA。通过多年来让客户免费使用浏览器,只是依靠WEB服务器和其 它产品贏利的战略,网景获得了现有的市场占有率。现在网景还可以从其站点免费下载,但 新版本只能免费使用90天,而且用于教育机构时可以免费。网景有一些公认的缺点,例如笨 拙的书签系统、难以显示和定位采用框架结构的网页、经常性的停止或崩溃,但是它已经可 以满足大多数用户浏览页面的要求。 网景最主要的竞争对手来自微软公司,微软的浏览器产品E( nternet Expl orer)正在挑战网 景市场份额第一的地位。微软的战略是把E作为免费的软件让用户直接从其网站下载。IE在 取代目前的A0L专利浏览器后也会获得一些份额。AOL专利浏览器已经被公认为毫无是处、缺 陷多多,A0L宁愿把E给自己的用户,也不愿意重新设计新的浏览器,这使得lE立即获得了 千万用户。另外,lE已经和 IWi ndows95操作系统捆绑起来,微软进一步计划将lE集成到操作系 统中去,从而使得 Wi ndows95用户实际上将IE作为他们的桌面。相比网景,IE有一些主要的优 点:页面装入较快、浏览器更加稳定、处理多框架页面效果更好。随着这两种浏览器版本的 提高,用户将会发现两个程序中有很多相同的功能,最终的胜负将取决于成本和个人的嗜 好 值得一提的是,尽管WB被定义为视觉媒体,它同样可以在不传送相关图形的情况下传送并显 示文档。局限于行终端的用户可以使用Lynx浏览器(见表1.6)。Lynx是堪萨斯大学开发的 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18
᭛ᴀᴤ᭭ⱘၦԧ䆲⫳њDŽ ⓿␌ GopherⳌ↨ˈ㔥义Ё⓿␌ϡ䳔㽕⫼᠋ⶹ䘧᳝݇᠔ᶹᡒֵᙃⱘ䆺㒚ഄഔDŽা㽕ऩߏ⡍ᅮⱘ ᭛ᴀǃᣝ䪂⠛ህৃҹ䖯㸠⓿␌ˈ䖭ѯৃ⚍ߏⱘܗ㋴ᘏ⿄Ў䍙᭛ᴀ䫒DŽϔᮺ⚍ߏњϔϾ 䍙᭛ᴀ䫒ˈ⫼᠋ህӮ㹿ᏺࠄ݊ᅗⱘ㔥⚍DŽϢGopherϡৠⱘᰃˈ䖭Ͼᮄⱘഄ⚍ϡϔᅮᰃϔϾ ሖ㒧ᵘⱘϞϔϾϟϔϾഄ⚍ˈ䍙᭛ᴀ䫒ৃҹᇚ⫼᠋ᏺࠄৠϔϾ㔥キⱘ݊ᅗഄᮍϪ⬠ ϔ䖍ⱘ㔥⚍DŽWEBϞⱘ↣ϔϾ᭛ḷ⿄ϔϾ㔥义ˈϔϾϧ䮼ⱘ᳡ࡵ఼Ϟⱘ᠔᳝㔥义ᘏ⿄Ўϔ Ͼ㔥キDŽϹḐഄ⫼䍙᭛ᴀ䫒䖯㸠⓿␌г㹿⿄ЎWEBކ⌾DŽ ⫼᠋ৃҹ䗮䖛䬂ܹഄഔᴹЎⳈⱘᡒࠄֵᙃDŽWEBⱘϔ⡍⚍ህᰃ˖⫼᠋⫼ᴹ⌣㾜㔥义ⱘ ᑣ˄⌣㾜఼˅гৃҹৠḋⱘ⫼Ѣ䆓䯂GopherFTPキ⚍ˈҢ㗠ϔᅮᑺϞ䙓ܡњᇍϧ䮼ⱘ GopherFTPᑨ⫼ᑣⱘ䳔∖DŽЎℸᓩܹњϔϾ㒳ϔⱘੑৡ㾘߭ˈᅗϡҙৃҹਞ䆝⌣㾜఼䖰䎱 ⾏キ⚍ⱘԡ㕂ˈЎ䞡㽕ⱘᰃৃҹਞ䆝⌣㾜఼䖰䎱⾏キ⚍ֵᙃⱘ㉏ൟˈՓᕫ⌣㾜఼ৃҹℷ⹂ ᰒ⼎DŽ䖭⾡ᷛޚḐᓣⱘഄഔህ⿄Ў㒳ϔ䌘⑤ᅮԡ఼˄ㅔ⿄URL˅ˈ݊ϔ㠀ḐᓣЎ˖ण䆂˖//䅵 ㅫᴎඳDŽ݊Ёण䆂㸼⼎キ⚍ⱘ㉏ൟˈ䅵ㅫᴎඳ㸼⼎キ⚍ⱘԡ㕂˄㾕㸼1.2˅DŽ㔥キURLЁⱘ httpҷ㸼䍙᭛ᴀӴ䕧ण䆂ˈᰃЏᴎᅶ᠋Ӵ䗕㔥㒰᭛ӊⱘᮍ⊩ПϔDŽ ⌣㾜఼П ⌣㾜㔥义ⱘ⌣㾜఼ᰃ䖲䖰䎱⾏キ⚍ⱘᅶ᠋᳡ࡵ఼ᑨ⫼ᑣˈᅗҢ᠔䖲ⱘキ⚍Ёϟ䕑⫼᠋ 䇋∖ⱘֵᙃˈᑊᰒ⼎⫼᠋ⲥ㾚఼Ϟˈ✊ৢᮁᓔ䖲DŽҢ䖰䎱⾏ЏᴎϞ᠔㦋ᕫⱘֵᙃҹϔ⾡ Ϣᑇৄ᮴݇ⱘḐᓣᄬˈ䖭⾡Ḑᓣ⿄Ў䍙᭛ᴀᷛ䆚䇁㿔˄ㅔ⿄HTML˅DŽHTMLҷⷕᰃ㒃᭛ᴀҷ ⷕˈ᭛ḷЁ᠔᳝ⱘᔶໄ䷇䛑ҹऩ⣀ⱘǃ䗮⫼ⱘ᭛ӊḐᓣᄬ˄՟བ˖ᔶҹGIFḐᓣֱᄬ Ӵ䗕ˈGIFᰃCompuServeᓔথⱘ⫼Ѣᖿ䗳᳝ᬜഄӴ䗕ᔶⱘḐᓣ˅DŽℷЎབℸˈ⌣㾜఼ᠡ ৃҹᰒ⼎ӏԩ㉏ൟ˄MacintoshǃPCUNIX˅䅵ㅫᴎϞⱘ᠔᳝㔥义DŽ⌣㾜఼ᘏᰃܜᰒ⼎㔥义ⱘ ᭛ᴀݙᆍˈ✊ৢݡᰒ⼎ℷϟ䕑ⱘ义䴶ⱘ݊ᅗݙᆍDŽা㽕䖭ѯᑇৄՓ⫼ⱘᰃৠϔϾ݀ৌⱘ⌣ 㾜఼ˈৠḋⱘ㔥义ህӮҹԧⳌৠⱘḋᰒ⼎ˈᕜᇥ᳝՟DŽ Ā⌣㾜఼ПāⱘЏ㾦ᰃ㔥᱃݀ৌⱘ㟾⍋ᆊ˄Navigator˅ˈⳂࠡऴњ㑺80%ⱘ⌣㾜఼Ꮦ എDŽ㔥᱃ᰃMarc Andreesen݊ৠџᓔথߎᴹⱘˈᅗᰃNCSA Telnet˄ϔϾ㹿ᑓ⊯Փ⫼ⱘ㔥 㒰⌣㾜఼˅ⱘ⌒⫳ѻકDŽ㔥᱃ᓔথ䯳ӡЁⱘ᭄Ҏᴹ㞾NCSAˈҪӀᛣ䆚ࠄᓔথWEBᡔᴃⱘ 䞡㽕ଚϮᛣНПৢ⾏ᓔњNCSADŽ䗮䖛ᑈᴹ䅽ᅶ᠋ܡ䌍Փ⫼⌣㾜఼ˈাᰃձ䴴WEB᳡ࡵ఼݊ ᅗѻક䌶߽ⱘ⬹ˈ㔥᱃㦋ᕫњ⦄᳝ⱘᏖഎऴ᳝⥛DŽ⦄㔥᱃䖬ৃҹҢ݊キ⚍ܡ䌍ϟ䕑ˈԚ ᮄ⠜ᴀা㛑ܡ䌍Փ⫼90ˈ㗠Ϩ⫼Ѣᬭ㚆ᴎᵘᯊৃҹܡ䌍DŽ㔥᱃᳝ϔѯ݀䅸ⱘ㔎⚍ˈ՟བー ⱘкㅒ㋏㒳ǃ䲒ҹᰒ⼎ᅮԡ䞛⫼Ḛᶊ㒧ᵘⱘ㔥义ǃ㒣ᐌᗻⱘذℶዽˈԚᰃᅗᏆ㒣ৃ ҹ⒵䎇᭄⫼᠋⌣㾜义䴶ⱘ㽕∖DŽ 㔥᱃᳔Џ㽕ⱘゲѝᇍᴹ㞾ᖂ䕃݀ৌˈᖂ䕃ⱘ⌣㾜఼ѻકIE(Internet Explorer)ℷᣥ㔥 ᱃Ꮦഎӑ乱ϔⱘഄԡDŽᖂ䕃ⱘ⬹ᰃᡞIEЎܡ䌍ⱘ䕃ӊ䅽⫼᠋ⳈҢ݊㔥キϟ䕑DŽIE পҷⳂࠡⱘAOLϧ߽⌣㾜఼ৢгӮ㦋ᕫϔѯӑ乱DŽAOLϧ߽⌣㾜఼Ꮖ㒣㹿݀䅸Ў↿᮴ᰃ໘ǃ㔎 䱋ˈAOLᅕᜓᡞIE㒭㞾Ꮕⱘ⫼᠋ˈгϡᜓᛣ䞡ᮄ䆒䅵ᮄⱘ⌣㾜఼ˈ䖭ՓᕫIEゟे㦋ᕫњϔ गϛ⫼᠋DŽˈIEᏆ㒣Windows95᪡㋏㒳ᤚ㒥䍋ᴹˈᖂ䕃䖯ϔℹ䅵ߦᇚIE䲚៤ࠄ᪡㋏ 㒳ЁএˈҢ㗠ՓᕫWindows95⫼᠋ᅲ䰙ϞᇚIEЎҪӀⱘḠ䴶DŽⳌ↨㔥᱃ˈIE᳝ϔѯЏ㽕ⱘӬ ⚍˖义䴶㺙ܹ䕗ᖿǃ⌣㾜఼ࡴ〇ᅮǃ໘⧚Ḛᶊ义䴶ᬜᵰདDŽ䱣ⴔ䖭ϸ⾡⌣㾜఼⠜ᴀⱘ ᦤ催ˈ⫼᠋ᇚӮথ⦄ϸϾᑣЁ᳝ᕜⳌৠⱘࡳ㛑ˈ᳔㒜ⱘ㚰䋳ᇚপއѢ៤ᴀϾҎⱘர དDŽ ؐᕫϔᦤⱘᰃˈሑㅵWEB㹿ᅮНЎ㾚㾝ၦԧˈᅗৠḋৃҹϡӴ䗕Ⳍ݇ᔶⱘᚙމϟӴ䗕ᑊᰒ ⼎᭛ḷDŽሔ䰤Ѣ㸠㒜ッⱘ⫼᠋ৃҹՓ⫼Lynx⌣㾜఼˄㾕㸼1.6˅DŽLynxᰃ㧼ᮃᄺᓔথⱘˈ ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ5/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第一章因特网与生物学家 页码,6/ 它允许用户通过键盘上的箭头键高亮显示并选中超级链接,用回车键来取代网景和E中必须 使用的鼠标。Lynx可以用于DS和UNX两种平台。 因特网( nternet)和企业内部网 Intranet) wEB通常被认为是一种与远方联系的渠道,其实同样的机制也可以用于同一机构内部的相互联 系,如:企业内部网。企业内部网利用WEB的简单界面,提供了一个容易使用的相关信息库 还提供了另一个广播或机构内部秘密联系的途径。当机构的成员离开到不同的建筑或城市 时,企业内部网就非常有用了。企业内部网是受保护的,非机构网络的用户禁止访问内部网 页,另外使用口令保护也很常见。 查询信息 很多用户用老式方式在WB上查询信息:按照单词的读音,使用如本书各章中的参考文献似的 列表,或使用网页中作者放置的超文本链接。即使是要寻找有明确目标的信息,通过单击在 页面之间跳转来寻找的方式也往往事倍功半。査询虚拟图书馆可以解决这一问题,虚拟图书 馆将网络资源按照不同的科目有组织地列出。有关生物学的虚拟图书馆有:哈福大学 Kei th Robi son维护的ww虚拟图书馆;衣阿华洲 Pedro coun nho编辑的 Pedro's分子生物学研究工 具;欧洲生物信息学研究所的EB生物目录,在本章结尾的列表中可以找到这些网站的URL 用搜索引擎也可以直接査询睚B。搜索引擎是一种在网页内容目录数据库中执行全文或关键字 查询的专门程序,其查询结果是满足条件的超级链接网站列表,用户可以访问列表中的任何 一个站点。不同的搜索引擎在编辑数据库的方法上有些细微区别,这些区别既表现在访问网 站上,也表现在阅读网站的数据上。有些搜索引擎只是将网页标题编成目录,而非网页全 文;有些引擎将短语看作一个单词来査找,而其它则只是将相邻的单词挑选出来。由于搜索 引擎算法中的这些差异,相同的査询请求用不同的搜索引擎返回的结果可能会有很大差别。 从表1.3中可以看出,同样是查询 genetic”,雅虎( Yahoo)的返回结果为1,而其它引擎 返回的结果都超过几千甚至达几万。另外表1.3中的数值很多都非常大,这也反映了万维网的 巨大规模。因此只有引擎将搜索结果按重要性分级(例如,单词出现在标题中比在网页正文中 更为重要),获得的查询结果才会真正有用。 为了实现这个功能,研究者开发出了新一类的搜索引擎�8#0变换引擎(meta- search engI ne)。变换引擎采用更为智能化的途径搜索网站,轮流用五到十种传统的搜索引擎执行 用户的请求,然后聚集查询结果,删除重复项,最后返回给用户一个无重复的有注释列表。 变换引擎的一大优点在于注重相关统计,使得结果列表更简短(见表1.3)。虽然列表变短 了,但所包含的站点却更为直接地反映了原查询要求。由于变换引擎必须轮流使用多个不同 的搜索引擎,所需要的执行时间就会更长,但是査询结果的较高可用性比多用的几分钟(有 时候只是几秒钟)查询时间更重要。可靠且容易使用的变换引擎有 SavvySearch 和 Metacraw|er。 减少返回结果的另一途径是减少査询集的大小,一些搜索引擎正是由于只覆盖某一专门领域 的网站而脱颖而出。本文写作时尚无生物学方面的专门引擎,(译者注:现在已经有了一个 生物学专业检索引擎,名为 NEEHOW,是一个中国人自己设计维护的专业检索引擎,URL: http://biologyneehow.org及http://biologyneehow.orgcn)比较受欢迎的搜索引擎还有 Look Smart,这是《读者文摘》杂志的一项服务,它将该机构的浓缩诀窍应用在了网络上的相 关领域 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18
ᅗܕ䆌⫼᠋䗮䖛䬂ⲬϞⱘㆁ༈䬂催҂ᰒ⼎ᑊ䗝Ё䍙㑻䫒ˈ⫼ಲ䔺䬂ᴹপҷ㔥᱃IEЁᖙ乏 Փ⫼ⱘ哴ᷛDŽLynxৃҹ⫼ѢDOSUNIXϸ⾡ᑇৄDŽ ⡍㔥˄Internet˅ӕϮݙ䚼㔥(Intranet) WEB䗮ᐌ㹿䅸Ўᰃϔ⾡Ϣ䖰ᮍ㘨㋏ⱘ⏴䘧ˈ݊ᅲৠḋⱘᴎࠊгৃҹ⫼Ѣৠϔᴎᵘݙ䚼ⱘⳌѦ㘨 ㋏ˈབ˖ӕϮݙ䚼㔥DŽӕϮݙ䚼㔥߽⫼WEBⱘㅔऩ⬠䴶ˈᦤկњϔϾᆍᯧՓ⫼ⱘⳌֵ݇ᙃᑧˈ 䖬ᦤկњϔϾᑓ᪁ᴎᵘݙ䚼⾬ᆚ㘨㋏ⱘ䗨ᕘDŽᔧᴎᵘⱘ៤ਬ⾏ᓔࠄϡৠⱘᓎㄥජᏖ ᯊˈӕϮݙ䚼㔥ህ䴲ᐌ᳝⫼њDŽӕϮݙ䚼㔥ᰃফֱᡸⱘˈ䴲ᴎᵘ㔥㒰ⱘ⫼᠋⽕ℶ䆓䯂ݙ䚼㔥 义ˈՓ⫼ষҸֱᡸгᕜᐌ㾕DŽ ᶹ䆶ֵᙃ ᕜ⫼᠋⫼㗕ᓣᮍᓣWEBϞᶹ䆶ֵᙃ˖ᣝ✻ऩ䆡ⱘ䇏䷇ˈՓ⫼བᴀкゴЁⱘখ㗗᭛⤂Ԑⱘ ߫㸼ˈՓ⫼㔥义Ё㗙ᬒ㕂ⱘ䍙᭛ᴀ䫒DŽेՓᰃ㽕ᇏᡒ᳝ᯢ⹂Ⳃᷛⱘֵᙃˈ䗮䖛ऩߏ 义䴶П䯈䏇䕀ᴹᇏᡒⱘᮍᓣгᕔᕔџࡳסञDŽᶹ䆶㰮ᢳк佚ৃҹ㾷އ䖭ϔ䯂乬ˈ㰮ᢳк 佚ᇚ㔥㒰䌘⑤ᣝ✻ϡৠⱘ⾥Ⳃ᳝㒘㒛ഄ߫ߎDŽ᳝݇⫳⠽ᄺⱘ㰮ᢳк佚᳝˖જ⽣ᄺKeith Robison㓈ᡸⱘWWW㰮ᢳк佚˗㸷䰓ढ⌆Pedro Couninho㓪䕥ⱘPedro's ߚᄤ⫳⠽ᄺⷨおᎹ ⫳⌆˗⠽ֵᙃᄺⷨお᠔ⱘEBI ⫳⠽Ⳃᔩˈᴀゴ㒧ሒⱘ߫㸼Ёৃҹᡒࠄ䖭ѯ㔥キⱘURLDŽ ⫼᧰㋶ᓩ᪢гৃҹⳈᶹ䆶WEBDŽ᧰㋶ᓩ᪢ᰃϔ⾡㔥义ݙᆍⳂᔩ᭄ᑧЁᠻ㸠ܼ᭛݇䬂ᄫ ᶹ䆶ⱘϧ䮼ᑣˈ݊ᶹ䆶㒧ᵰᰃ⒵䎇ᴵӊⱘ䍙㑻䫒㔥キ߫㸼ˈ⫼᠋ৃҹ䆓䯂߫㸼Ёⱘӏԩ ϔϾキ⚍DŽϡৠⱘ᧰㋶ᓩ᪢㓪䕥᭄ᑧⱘᮍ⊩Ϟ᳝ѯ㒚ᖂऎ߿ˈ䖭ѯऎ߿᮶㸼⦄䆓䯂㔥 キϞˈг㸼⦄䯙䇏㔥キⱘ᭄ϞDŽ᳝ѯ᧰㋶ᓩ᪢াᰃᇚ㔥义ᷛ乬㓪៤Ⳃᔩˈ㗠䴲㔥义ܼ ᭛˗᳝ѯᓩ᪢ᇚⷁ䇁ⳟϔϾऩ䆡ᴹᶹᡒˈ㗠݊ᅗ߭াᰃᇚⳌ䚏ⱘऩ䆡ᣥ䗝ߎᴹDŽ⬅Ѣ᧰㋶ ᓩ᪢ㅫ⊩Ёⱘ䖭ѯᏂᓖˈⳌৠⱘᶹ䆶䇋∖⫼ϡৠⱘ᧰㋶ᓩ᪢䖨ಲⱘ㒧ᵰৃ㛑Ӯ᳝ᕜᏂ߿DŽ Ң㸼1.3Ёৃҹⳟߎˈৠḋᰃᶹ䆶“genetic”ˈ䲙㰢˄Yahoo˅ⱘ䖨ಲ㒧ᵰЎˈ㗠݊ᅗᓩ᪢ 䖨ಲⱘ㒧ᵰ䛑䍙䖛ग⫮㟇䖒ϛDŽ㸼1.3Ёⱘ᭄ؐᕜ䛑䴲ᐌˈ䖭гডњϛ㓈㔥ⱘ Ꮌ㾘DŽℸা᳝ᓩ᪢ᇚ᧰㋶㒧ᵰᣝ䞡㽕ᗻߚ㑻՟བˈऩ䆡ߎᷛ⦃乬Ё↨㔥义ℷ᭛Ё Ў䞡㽕ˈ㦋ᕫⱘᶹ䆶㒧ᵰᠡӮⳳℷ᳝⫼DŽ Ўњᅲ⦄䖭Ͼࡳ㛑ˈⷨお㗙ᓔথߎњᮄϔ㉏ⱘ᧰㋶ᓩ᪢��বᤶᓩ᪢˄meta-search engine˅DŽবᤶᓩ᪢䞛⫼Ўᱎ㛑࣪ⱘ䗨ᕘ᧰㋶㔥キ, 䕂⌕⫼Ѩࠄक⾡Ӵ㒳ⱘ᧰㋶ᓩ᪢ᠻ㸠 ⫼᠋ⱘ䇋∖ˈ✊ৢ㘮䲚ᶹ䆶㒧ᵰˈߴ䰸䞡乍ˈ᳔ৢ䖨ಲ㒭⫼᠋ϔϾ᮴䞡ⱘ᳝⊼䞞߫㸼DŽ বᤶᓩ᪢ⱘϔӬ⚍Ѣ⊼䞡Ⳍ݇㒳䅵ˈՓᕫ㒧ᵰ߫㸼ㅔⷁ˄㾕㸼1.3˅DŽ㱑✊߫㸼বⷁ њˈԚ᠔ࣙⱘキ⚍ैЎⳈഄডњॳᶹ䆶㽕∖DŽ⬅Ѣবᤶᓩ᪢ᖙ乏䕂⌕Փ⫼Ͼϡৠ ⱘ᧰㋶ᓩ᪢ˈ᠔䳔㽕ⱘᠻ㸠ᯊ䯈ህӮ䭓ˈԚᰃᶹ䆶㒧ᵰⱘ䕗催ৃ⫼ᗻ↨⫼ⱘߚ䩳˄᳝ ᯊাᰃ金䩳˅ᶹ䆶ᯊ䯈䞡㽕DŽৃ䴴ϨᆍᯧՓ⫼ⱘবᤶᓩ᪢᳝SavvySearch MetaCrawlerDŽ ޣᇥ䖨ಲ㒧ᵰⱘϔ䗨ᕘᰃޣᇥᶹ䆶䲚ⱘᇣˈϔѯ᧰㋶ᓩ᪢ℷᰃ⬅Ѣা㽚Ⲫᶤϔϧ䮼乚ඳ ⱘ㔥キ㗠㜅乪㗠ߎDŽᴀ᭛ݭᯊᇮ᮴⫳⠽ᄺᮍ䴶ⱘϧ䮼ᓩ᪢ˈ˄䆥㗙⊼˖⦄Ꮖ㒣᳝њϔϾ ⫳⠽ᄺϧϮẔ㋶ᓩ᪢ˈৡЎNEEHOWˈᰃϔϾЁҎ㞾Ꮕ䆒䅵㓈ᡸⱘϧϮẔ㋶ᓩ᪢ˈURL˖ http://biology.neehow.orgঞhttp://biology.neehow.org.cn˅↨䕗ফ䖢ⱘ᧰㋶ᓩ᪢䖬᳝ LookSmart, 䖭ᰃlj䇏㗙᭛ᨬNJᴖᖫⱘϔ乍᳡ࡵˈᅗᇚ䆹ᴎᵘⱘ⌧㓽䆔ちᑨ⫼њ㔥㒰ϞⱘⳌ ݇乚ඳDŽ ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ6/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第一章因特网与生物学家 页码,7/ 图1.1因特网上各域名主机数量的增长。因特网上主机的总数已经超过12,000,000台,商业 站点数量(com)在1994年首次超过教育站点(edu)。[Data Network Wi zards (http://www.nw.com)] 图1.2剖析一个电子邮件(e-mai)消息(各部分已经标示出来)。这是一个NCB帮助服务器 对求助消息的自动答复。 图1.4用 Fetch来下载一个文件。在 I ndi ana大学的分子生物学FTP服务器(上图)建立一个 匿名FTP进程来下载 Cl ustal w序列比对程序(下图)。注意基于GU的程序与图1.3所示UNX下 程序的区别。 图1.5用 TurboGopher来阅读一个文本文件。窗口标题显示了寻找图中文件的浏览路径,从 Mi nesta大学的“ Home Gopher”开始到 Johns Hopkins大学的 Wel ch医学图书馆结束。这种 浏览不需要知道所寻找的信息的地址或位置,搜索在一系列层次结构的菜单中进行。 图1.6比较一个基于Web的图形用户界面浏览器( Mi crosoft Internet Explorer)和一个纯 文本Web浏览器(Lynx)。两个浏览器都指向 Stanford大学的 Saccharomyces基因组数据库主 页 上一页 下一页 返回目录 返回茶庄 file://E:wcb生物信息学(中译本)\第一章因特网与生物学家.htm 2005-1-18
1.1 ⡍㔥ϞඳৡЏᴎ᭄䞣ⱘ䭓DŽ⡍㔥ϞЏᴎⱘᘏ᭄Ꮖ㒣䍙䖛12,000,000ৄˈଚϮ キ⚍᭄䞣(.com)1994ᑈ佪䍙䖛ᬭ㚆キ⚍(.edu)DŽ[Data Network Wizards (http://www.nw.com)] 1.2 ࠪᵤϔϾ⬉ᄤ䚂ӊ(e-mail)⍜ᙃ˄䚼ߚᏆ㒣ᷛ⼎ߎᴹ˅DŽ䖭ᰃϔϾNCBIᐂࡽ᳡ࡵ఼ ᇍ∖ࡽ⍜ᙃⱘ㞾ࡼㄨDŽ 1.4 ⫼Fetchᴹϟ䕑ϔϾ᭛ӊDŽIndianaᄺⱘߚᄤ⫳⠽ᄺFTP᳡ࡵ˄఼Ϟ˅ᓎゟϔϾ ओৡFTP䖯ᴹϟ䕑ClustalWᑣ߫↨ᇍᑣ˄ϟ˅DŽ⊼ᛣѢGUIⱘᑣϢ1.3᠔⼎UNIXϟ ᑣⱘऎ߿DŽ 1.5 ⫼TurboGopherᴹ䯙䇏ϔϾ᭛ᴀ᭛ӊDŽにষᷛ乬ᰒ⼎њᇏᡒЁ᭛ӊⱘ⌣㾜䏃ᕘˈҢ Minnesotaᄺⱘ“Home Gopher”ᓔྟࠄJohns HopkinsᄺⱘWelchएᄺк佚㒧ᴳDŽ䖭⾡ ⌣㾜ϡ䳔㽕ⶹ䘧᠔ᇏᡒⱘֵᙃⱘഄഔԡ㕂ˈ᧰㋶ϔ㋏߫ሖ㒧ᵘⱘ㦰ऩЁ䖯㸠DŽ 1.6 ↨䕗ϔϾѢWebⱘᔶ⫼᠋⬠䴶⌣㾜఼˄Microsoft Internet Explorer˅ϔϾ㒃 ᭛ᴀWeb⌣㾜఼˄Lynx˅DŽϸϾ⌣㾜఼䛑ᣛStanfordᄺⱘSaccharomyces㒘᭄ᑧЏ 义DŽ Ϟϔ义 ϟϔ义 䖨ಲⳂᔩ 䖨ಲ㤊ᑘ ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ 义ⷕˈ7/7 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ϔゴ⡍㔥Ϣ⫳⠽ᄺᆊ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com