页面抽取的问题 ●Wveb上存在大量的数据,以半结构化的 HTML页面形式存在 ●Wveb数据集成需要将半结构化的数据转换 成为结构化的数据 ●页面抽取的任务:按照用户要求,将半结 构化的Web数据转换成为结构化数据 ●完成页面抽取任务的程序通常叫做 wrapper3 页面抽取的问题 ⚫Web上存在大量的数据,以半结构化的 HTML页面形式存在 ⚫Web数据集成需要将半结构化的数据转换 成为结构化的数据 ⚫页面抽取的任务:按照用户要求,将半结 构化的Web数据转换成为结构化数据 ⚫完成页面抽取任务的程序通常叫做wrapper