正在加载图片...
第2章湖用数访377 下载 库中的一个表中,而另一个表可能包含第一个表所引用的所有文档。这两个表的概念在 Indexing Service中表示为 Word List和 Saved Index 有了 Indexing Service,离散数据库就是我们所知的目录( catalog)。正如 SQL Server能处 理多个数据库一样, Indexing service也可以处理多个目录。目录一般被捆绑在主机所提 供的基于 Internet的服务上。因此,假如你有一个Web站点并用NNTP服务提供新闻组, 可以为它们提供一个目录。如果使用虚拟Web站点,它们中的每一个也可以有一个目 录 当服务启动时,他知道从哪里开始搜索索引的条目,因此他建立了一个被索引的文件列 表。我们把这项工作称为扫描。被索引的条目可以是存储于文件夹中的任何文件。文件夹通 常被设置为服务环境中的虚拟路径。这就是我们所知的作用范围。 旦扫描过程完成,过滤过程就开始了。在过滤期间, Indexing service将试图打开一个 候选文件。一旦打开该文件, Indexing service就会对此文件进行解析,并为每个关键字构 个索引条目。同时,也为文件计算其他的键参数。解析一个文件需要了解文件的结构。这 个信息收集在被称为过滤器的库文件中。 Microsoft t经开发了大多数在 Internet和 Internet服 务中常见的内容类型的过滤器 使用非标准或非 Microsoft文件格式的厂商也提供自己的过滤器。例如, Adobe公 司就为PDF文档标准提供了过滤器。因此,如果你创建了自己的文件格式,那么应该 为它定义一个过滤器。 “特征”和“文档属性”是两个需要理解的重要概念。 在某种意义上,特征( characterization)指的是文档的摘要(或执行概要)。特征通常是文档 中可表示部分的前n个字符。可表示部分一般是显示的(或表现的)文档的部分内容。比如一个 HTML页面的特征一般是指位于<BODY>标记之间的内容(自然,也有例外)。 Indexing Service 允许用户决定文档的特征有多大。一般来说,250~500个词足够了。当从 Indexing Service返回 查询结果时,特征是经常显示的信息。文本的开头部分通常是显示的最佳选择,因为他可使 用户很快就能决定这个文档是否需要进行深入研究 然而,文档的大量附加信息也可以从 Indexing service的文档属性中获得。这些属性是正 式的 ActiveX文档属性。 Indexing Service说明了40多种这样的属性。文件大小、数据的创建时 间、最近访问时间、最近修改时间以及文件的位置是,ASP应用程序中对 Indexing service查 询起决定作用的最重要的属性。 Indexing Service3.0与 Index server的对比 如果你在IS3.0或40环境下开发ASP程序,也许想知道为什么要使用 Indexing service而 不是 Index server,他们不是一回事吗? 可以说是,也可以说不是。 Indexing service与 Index server完成了相同的工作,即创建了 引用文档的查询数据库。但 Indexing service带来了一些新的以及改进过的功能 那些抱怨 Microsoft在IS40环境下的 NT Workstation中删除了 Index server的人,现在可 以放心了,因为在 Windows2000 Professiona中包含 Indexing service。事实上在 Windows2000家族中,当查找文件夹或文件时, Start菜单中的査找选项就使用了 Indexing Service 现在结果集可以由 Query对象获得。利用这种方法,可以通过使用某个属性向 Indexing库中的一个表中,而另一个表可能包含第一个表所引用的所有文档。这两个表的概念在 Indexing Service中表示为Word List和Saved Index。 • 有了Indexing Service,离散数据库就是我们所知的目录 ( c a t a l o g )。正如SQL Server能处 理多个数据库一样,Indexing Service也可以处理多个目录。目录一般被捆绑在主机所提 供的基于I n t e r n e t的服务上。因此,假如你有一个 We b站点并用N N T P服务提供新闻组, 可以为它们提供一个目录。如果使用虚拟 We b站点,它们中的每一个也可以有一个目 录。 当服务启动时,他知道从哪里开始搜索索引的条目,因此他建立了一个被索引的文件列 表。我们把这项工作称为扫描。被索引的条目可以是存储于文件夹中的任何文件。文件夹通 常被设置为服务环境中的虚拟路径。这就是我们所知的作用范围。 一旦扫描过程完成,过滤过程就开始了。在过滤期间, Indexing Service将试图打开一个 候选文件。一旦打开该文件, Indexing Service就会对此文件进行解析,并为每个关键字构建 一个索引条目。同时,也为文件计算其他的键参数。解析一个文件需要了解文件的结构。这 个信息收集在被称为过滤器的库文件中。 M i c r o s o f t已经开发了大多数在 I n t e r n e t和Internet 服 务中常见的内容类型的过滤器。 使用非标准或非M i c r o s o f t文件格式的厂商也提供自己的过滤器。例如, A d o b e公 司就为P D F文档标准提供了过滤器。因此,如果你创建了自己的文件格式,那么应该 为它定义一个过滤器。 “特征”和“文档属性”是两个需要理解的重要概念。 在某种意义上,特征 ( c h a r a c t e r i z a t i o n )指的是文档的摘要 (或执行概要)。特征通常是文档 中可表示部分的前 n个字符。可表示部分一般是显示的 (或表现的)文档的部分内容。比如一个 H T M L页面的特征一般是指位于< B O D Y >标记之间的内容(自然,也有例外)。Indexing Service 允许用户决定文档的特征有多大。一般来说, 2 5 0 ~ 5 0 0个词足够了。当从Indexing Service返回 查询结果时,特征是经常显示的信息。文本的开头部分通常是显示的最佳选择,因为他可使 用户很快就能决定这个文档是否需要进行深入研究。 然而,文档的大量附加信息也可以从 Indexing Service的文档属性中获得。这些属性是正 式的A c t i v e X文档属性。Indexing Service说明了4 0多种这样的属性。文件大小、数据的创建时 间、最近访问时间、最近修改时间以及文件的位置是, A S P应用程序中对 Indexing Service查 询起决定作用的最重要的属性。 Indexing Service 3.0与Index Server的对比 如果你在IIS 3.0或4 . 0环境下开发A S P程序,也许想知道为什么要使用 Indexing Service而 不是Index Server,他们不是一回事吗? 可以说是,也可以说不是。 Indexing Service与Index Server完成了相同的工作,即创建了 引用文档的查询数据库。但 Indexing Service带来了一些新的以及改进过的功能。 • 那些抱怨M i c r o s o f t在IIS 4.0环境下的NT Wo r k s t a t i o n中删除了Index Server的人,现在可 以放心了,因为在 Windows 2000 Professional 中包含 Indexing Service。事实上在 Windows 2000 家族中,当查找文件夹或文件时, S t a r t菜单中的查找选项就使用了 Indexing Service。 • 现在结果集可以由 Q u e r y对象获得。利用这种方法,可以通过使用某个属性向 I n d e x i n g 第1 2章 通用数据访问计计377 下载
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有