第五章空间数据采集与处理 第一节数据源种类 地理信息系统的数据源是指建立地理信息系统数据库所需要的各种类型数据的来源 地理信息系统的数据源是多种多样的,并随系统功能的不同而不同,主要包括以下各种: 地图 各种类型的地图是GIS最主要的数据源,因为地图是地理数据的传统描述形式,是具 有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间 关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。我国大多数的 GIS系统其图形数据大部分都来自地图。但由于地图以下的特点,对其应用时须加以注意 1、地图存储介质的缺陷由于地图多为纸质,由于存放条件的不同,都存在不同程度 的变形,具体应用时,须对其进行纠正 2、地图现势性较差由于传统地图更新需要的周期较长,造成现存地图的现势性不能 完全满足实际的需要。 3、地图投影的转换由于地图投影的存在,使得对不同地图投影的地图数据进行交流 前,须先进行地图投影的转换 二、遥感影象数据 遥感影象是GIS中一个极其重要的信息源 通过遥感影象可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影象 还可以取得周期性的资料,这些都为GIS提供了丰富的信息。但是因为每种遥感影象都有 其自身的成像规律、变形规律,所以对其的应用要注意影象的纠正、影象的分辨率、影象 的解译特征等方面的问题 三、统计数据 国民经济的各种统计数据常常也是GIS的数据源。如人口数量、人口构成、国民生产 总值等等 四、实测数据 各种实测数据特别是一些GPS点位数据、地籍测量数据常常是GIS的一个很准确和很
53 第五章 空间数据采集与处理 第一节 数据源种类 地理信息系统的数据源是指建立地理信息系统数据库所需要的各种类型数据的来源。 地理信息系统的数据源是多种多样的,并随系统功能的不同而不同,主要包括以下各种: 一、 地图 各种类型的地图是 GIS 最主要的数据源,因为地图是地理数据的传统描述形式,是具 有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间 关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。我国大多数的 GIS 系统其图形数据大部分都来自地图。但由于地图以下的特点,对其应用时须加以注意。 1、 地图存储介质的缺陷 由于地图多为纸质,由于存放条件的不同,都存在不同程度 的变形,具体应用时,须对其进行纠正。 2、 地图现势性较差 由于传统地图更新需要的周期较长,造成现存地图的现势性不能 完全满足实际的需要。 3、 地图投影的转换 由于地图投影的存在,使得对不同地图投影的地图数据进行交流 前,须先进行地图投影的转换。 二、 遥感影象数据 遥感影象是 GIS 中一个极其重要的信息源。 通过遥感影象可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影象 还可以取得周期性的资料,这些都为 GIS 提供了丰富的信息。但是因为每种遥感影象都有 其自身的成像规律、变形规律,所以对其的应用要注意影象的纠正、影象的分辨率、影象 的解译特征等方面的问题。 三、 统计数据 国民经济的各种统计数据常常也是 GIS 的数据源。如人口数量、人口构成、国民生产 总值等等。 四、 实测数据 各种实测数据特别是一些 GPS 点位数据、地籍测量数据常常是 GIS 的一个很准确和很
现势的资料。 五、数字数据 目前,随着各种专题图件的制作和各种GIS系统的建立,直接获取数字图形数据和属 性数据的可能性越来越大。数字数据也成为GIS信息源不可缺少的一部分。但对数字数据 的采用需注意数据格式的转换和数据精度、可信度的问题 六、各种文字报告和立法文件 各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划 管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。 对于一个多用途的或综合型的系统,一般都要建立一个大而灵活的数据库,以支持其 非常广泛的应用范围。而对于专题型和区域型统一的系统,则数据类型与系统功能之间具 有非常密切的关系。 第二节空间数据采集 、属性数据的采集 属性数据即空间实体的特征数据,一般包括名称、等级、数量、代码等多种形式,属 性数据的内容有时直接记录在栅格或矢量数据文件中,有时则单独输入数据库存储为属性 文件,通过关键码与图形数据相联系。 对于要输入属性库的属性数据,通过键盘则可直接键入。 对于要直接记录到栅格或矢量数据文件中的属性数据,则必须先对其进行编码,将各 种属性数据变为计算机可以接受的数字或字符形式,便于GIS存储管理。 下面,主要从属性数据的编码原则、编码内容、编码方法方面作以说明 1、编码原则 属性数据编码一般要基于以下三个原则 (1)编码的系统性和科学性。编码系统在逻辑上必须满足所涉及学科的科学分类方法, 以体现该类属性本身的自然系统性。另外,还要能反映出同一类型中不同的级别特点。 个编码系统能否有效运作其核心问题就在于此。 (2)编码的一致性。一致性是指对象的专业名词、术语的定义等必须严格保证一致 对代码所定义的同一专业名词、术语必须是唯一的。 (3)编码的标准化和通用性。为满足未来有效的信息传输和交流,所制定的编码系统
54 现势的资料。 五、 数字数据 目前,随着各种专题图件的制作和各种 GIS 系统的建立,直接获取数字图形数据和属 性数据的可能性越来越大。数字数据也成为 GIS 信息源不可缺少的一部分。但对数字数据 的采用需注意数据格式的转换和数据精度、可信度的问题。 六、 各种文字报告和立法文件 各种文字报告和立法文件在一些管理类的 GIS 系统中,有很大的应用,如在城市规划 管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。 对于一个多用途的或综合型的系统,一般都要建立一个大而灵活的数据库,以支持其 非常广泛的应用范围。而对于专题型和区域型统一的系统,则数据类型与系统功能之间具 有非常密切的关系。 第二节 空间数据采集 一、属性数据的采集 属性数据即空间实体的特征数据,一般包括名称、等级、数量、代码等多种形式,属 性数据的内容有时直接记录在栅格或矢量数据文件中,有时则单独输入数据库存储为属性 文件,通过关键码与图形数据相联系。 对于要输入属性库的属性数据,通过键盘则可直接键入。 对于要直接记录到栅格或矢量数据文件中的属性数据,则必须先对其进行编码,将各 种属性数据变为计算机可以接受的数字或字符形式,便于 GIS 存储管理。 下面,主要从属性数据的编码原则、编码内容、编码方法方面作以说明。 1、 编码原则 属性数据编码一般要基于以下三个原则: (1)编码的系统性和科学性。编码系统在逻辑上必须满足所涉及学科的科学分类方法, 以体现该类属性本身的自然系统性。另外,还要能反映出同一类型中不同的级别特点。一 个编码系统能否有效运作其核心问题就在于此。 (2)编码的一致性。一致性是指对象的专业名词、术语的定义等必须严格保证一致, 对代码所定义的同一专业名词、术语必须是唯一的。 (3)编码的标准化和通用性。为满足未来有效的信息传输和交流,所制定的编码系统
必须在有可能的条件下实现标准化 我国目前正在研究编码的标准化问题,并对某些项目作了规定。如中华人民共和国行 政区划代码使用国家颁布的GB-2260-80编码,其中有省(市、自治区)三位,县(区)三位 其余三位由用户自己定义,最多为十位。编码的标准化就是拟定统一的代码内容、码位长 度、码位分配和码位格式为大家所采用。因此,编码的标准化为数据的通用性创造了条件。 当然,编码标准化的实现将经历一个分步渐进的过程,并且只能是适度的,这是由于地理 对象的复杂性和区域差异性所决定的。 (4)编码的简捷性。在满足国家标准的前提下、每一种编码应该是以最小的数据量载 负最大的信息量,这样,既便于计算机存贮和处理,又具有相当的可读性。 (5)编码的可扩展性。虽然代码的码位一般要求紧凑经济、减少冗余代码,但应考虑 到实际使用时往往会出现新的类型需要加入到编码系统中,因此编码的设置应留有扩展的 余地,避免新对象的出现而使原编码系统失效、造成编码错乱现象 2、编码内容 属性编码一般包括三个方面的内容: (1)登记部分,用来标识属性数据的序号,可以是简单的连续编号,也可划分不同层 次进行顺序编码; (2)分类部分,用来标识属性的地理特征,可采用多位代码反映多种特征 (3)控制部分,用来通过一定的查错算法,检査在编码、录入和传输中的错误,在属 性数据量较大情况下具有重要意义 3、编码方法 编码的一般方法是 (1)列出全部制图对象清单 (2)制定对象分类,分级原则和指标将制图对象进行分类、分级 (3)拟定分类代码系统。 (4)设定代码及其格式。设定代码使用的字符和数字、码位长度、码位分配等 (5)建立代码和编码对象的对照表.这是编码最终成果档案,是数据输人计算机进行 编码的依据。 属性的科学分类体系无疑是GlS中属性编码的基础。目前,较为常用的编码方法有层 次分类编码法与多源分类编码法两种基本类型 1)层次分类编码法: 是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出 分类对象的类别,代码结构有严格的隶属关系
55 必须在有可能的条件下实现标准化。 我国目前正在研究编码的标准化问题,并对某些项目作了规定。如中华人民共和国行 政区划代码使用国家颁布的 GB—2260—80 编码,其中有省(市、自治区)三位,县(区)三位。 其余三位由用户自己定义,最多为十位。编码的标准化就是拟定统一的代码内容、码位长 度、码位分配和码位格式为大家所采用。因此,编码的标准化为数据的通用性创造了条件。 当然,编码标准化的实现将经历一个分步渐进的过程,并且只能是适度的,这是由于地理 对象的复杂性和区域差异性所决定的。 (4)编码的简捷性。在满足国家标准的前提下、每一种编码应该是以最小的数据量载 负最大的信息量,这样,既便于计算机存贮和处理,又具有相当的可读性。 (5)编码的可扩展性。虽然代码的码位一般要求紧凑经济、减少冗余代码,但应考虑 到实际使用时往往会出现新的类型需要加入到编码系统中,因此编码的设置应留有扩展的 余地,避免新对象的出现而使原编码系统失效、造成编码错乱现象。 2、编码内容 属性编码一般包括三个方面的内容: (1)登记部分,用来标识属性数据的序号,可以是简单的连续编号,也可划分不同层 次进行顺序编码; (2)分类部分,用来标识属性的地理特征,可采用多位代码反映多种特征; (3)控制部分,用来通过一定的查错算法,检查在编码、录入和传输中的错误,在属 性数据量较大情况下具有重要意义。 3、编码方法 编码的一般方法是: (1)列出全部制图对象清单。 (2)制定对象分类,分级原则和指标将制图对象进行分类、分级。 (3)拟定分类代码系统。 (4)设定代码及其格式。设定代码使用的字符和数字、码位长度、码位分配等。 (5)建立代码和编码对象的对照表.这是编码最终成果档案,是数据输人计算机进行 编码的依据。 属性的科学分类体系无疑是 GIS 中属性编码的基础。目前,较为常用的编码方法有层 次分类编码法与多源分类编码法两种基本类型。 1)层次分类编码法: 是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出 分类对象的类别,代码结构有严格的隶属关系
2)多源分类编码法 又称独立分类编码法。是指对于一个特定的分类目标,根据诸多不同的分类依据分别 进行编码,各位数字代码之间并没有隶属关系 由此可见,该种编码方法一般具有较大的信息载量,有利于对于空间信息的综合分析。 在实际工作中,也往往将以上两种编码方法结合使用,以达到更理想的效果。 图形数据的采集 图形数据的输入实际上就是图形的数字化过程。一般有两种方法: 1、手扶跟踪数字化仪输入 (1)手扶跟踪数字化仪 手扶跟踪数字化仪,根据其采集数据的方式分为机械式、超声波式和全电子式三种,其 中全电子式数字化仪精度最高,应用最广。按照其数字化版面的大小可分为AO、A1、A2 数字化仪由电磁感应板、游标和相应的电子电路组成。这种设备利用电磁感应原理:在 电磁感应板的x,y方向上有许多平行的印刷线,每隔200μm一条。游标中装有一个线圈。 当使用者在电磁感应板上移动游标到图件的指定位置,并将十字叉丝的交点对准数字化的 点位,按动相应的按钮时,线圈中就会产生交流信号,十字叉丝的中心也便产生了一个电 磁场,当游标在电磁感应板上运动时,板下的印制线上就会产生感应电流。印制板周围的 多路开关等线路可以检测出最大信号的位置,即十字叉线中心所在的位置,从而得到该点 的坐标值。 (2)数字化过程 把待数字化的图件固定在图形输入板上,首先用鼠标器输入图幅范围和至少四个控制 点的坐标,随后即可输入图幅内各点、曲线的坐标 通过数字化仪采集数据数据量小,数据处理的软件也比较完备,但由于数字化的速度 比较慢,工作量大,自动化程度低,数字化的精度与作业员的操作有很大关系,所以,目 前很多单位在大批量数字化时,已不再采用它 2、扫描仪输入 (1)扫描仪简介 扫描仪直接把图形(如地形图)和图象(如遥感影象、照片)扫描输入到计算机中,以象 素信息进行存储表示的设备。按其所支持的颜色分类,可分为单色扫描仪和彩色扫描仪 按所采用的固态器件又分为电荷耦合器件(αCD)扫描仪、MOS电路扫描仪、紧贴型扫描仪等; 按扫描宽度和操作方式分为大型扫描仪、台式扫描仪和手动式扫描仪
56 2)多源分类编码法 又称独立分类编码法。是指对于一个特定的分类目标,根据诸多不同的分类依据分别 进行编码,各位数字代码之间并没有隶属关系。 由此可见,该种编码方法一般具有较大的信息载量,有利于对于空间信息的综合分析。 在实际工作中,也往往将以上两种编码方法结合使用,以达到更理想的效果。 二、图形数据的采集 图形数据的输入实际上就是图形的数字化过程。一般有两种方法: 1、手扶跟踪数字化仪输入 (1)手扶跟踪数字化仪 手扶跟踪数字化仪,根据其采集数据的方式分为机械式、超声波式和全电子式三种, 其 中全电子式数字化仪精度最高,应用最广。按照其数字化版面的大小可分为 A0、A1、A2、 A3、A4 等。 数字化仪由电磁感应板、游标和相应的电子电路组成。这种设备利用电磁感应原理:在 电磁感应板的 x,y 方向上有许多平行的印刷线,每隔 200μm 一条。游标中装有一个线圈。 当使用者在电磁感应板上移动游标到图件的指定位置,并将十字叉丝的交点对准数字化的 点位,按动相应的按钮时,线圈中就会产生交流信号,十字叉丝的中心也便产生了一个电 磁场,当游标在电磁感应板上运动时,板下的印制线上就会产生感应电流。印制板周围的 多路开关等线路可以检测出最大信号的位置,即十字叉线中心所在的位置,从而得到该点 的坐标值。 (2)数字化过程 把待数字化的图件固定在图形输入板上,首先用鼠标器输入图幅范围和至少四个控制 点的坐标,随后即可输入图幅内各点、曲线的坐标。 通过数字化仪采集数据数据量小,数据处理的软件也比较完备,但由于数字化的速度 比较慢,工作量大,自动化程度低,数字化的精度与作业员的操作有很大关系,所以,目 前很多单位在大批量数字化时,已不再采用它。 2、 扫描仪输入 (1) 扫描仪简介 扫描仪直接把图形(如地形图)和图象(如遥感影象、照片)扫描输入到计算机中,以象 素信息进行存储表示的设备。按其所支持的颜色分类,可分为单色扫描仪和彩色扫描仪; 按所采用的固态器件又分为电荷耦合器件(CCD)扫描仪、MOS 电路扫描仪、紧贴型扫描仪等; 按扫描宽度和操作方式分为大型扫描仪、台式扫描仪和手动式扫描仪
CCD扫描仪的工作原理是:用光源照射原稿,投射光线经过一组光学镜头射到CCD器件 上,再经过模/数转换器,图象数据暂存器等,最终输入到计算机。CCD感光元件阵列是逐 行读取原稿的。为了使投射在原稿上的光线均匀分布,扫描仪中使用的是长条形光源。对 于黑白扫描仪,用户可以选择黑白颜色所对应电压的中间值作为阈值,凡低于阈值的电压 就为0(黑色),反之为1(白色)。而在灰度扫描仪中,每个象素有多个灰度层次。彩色扫 描仪的工作原理与灰度扫描仪的工作原理相似,不同之处在于彩色扫描仪要提取原稿中的 彩色信息。扫描仪的幅面有A,A,A,A等。扫描仪的分辨率是指在原稿的单位长度(英 寸)上取样的点数,单位是dpi,常用的分辨率有300-1000dpi之间。扫描图象的分辨率越 高,所需的存储空间就越大。现在多数扫描仪都提供了可选择分辨率的功能。对于复杂图 象,可选用较高的分辨率:对于较简单的图象,就选择较低的分辨率。 (2)扫描过程 扫描时,必须先进行扫描参数的设置,包括 a、扫描模式的设置,(分二值、灰度、百万种彩色),对地形图的扫描一般采用二值扫 描,或灰度扫描。对彩色航片或卫片采用百万种彩色扫描,对黑白航片或卫片采用 灰度扫描。 、扫描分辨率的设置,根据扫描要求,对地形图的扫描一般采用300dpi或更高的分 辨率。 C、针对一些特殊的需要,还可以调整亮度、对比度、色调、GAMA曲线等 d、设定扫描范围 扫描参数设置完后,即可通过扫描获得某个地区的栅格数据 通过扫描获得的是栅格数据,数据量比较大。如一张地形图采用300dpi灰度扫描其数 据量就有20兆左右。除此之外,扫描获得的数据还存在着噪声和中间色调像元的处理问题。 噪声是指不属于地图内容的斑点污渍和其它模糊不清的东西形成的像元灰度值。噪音范围 很广,没有简单有效的方法能加以完全消除,有的软件能去除一些小的脏点,但有些地图 内容如小数点等和小的脏点很难区分。对于中间色调像元,则可以通过选择合适的阈值选 用一些软件如 Photoshop等来处理 一般对获得的栅格数据还要进行一些后续处理如图象纠正、矢量化等 扫描输入因其输入速度快、不受人为因素的影响、操作简单而越来越受到大家的欢迎, 再加之计算杋运算速度、存储容量的提高和矢量化软件的踊跃出现,使得扫描输入已成为 图形数据输入的主要方法
57 CCD 扫描仪的工作原理是:用光源照射原稿,投射光线经过一组光学镜头射到 CCD 器件 上,再经过模/数转换器,图象数据暂存器等,最终输入到计算机。CCD 感光元件阵列是逐 行读取原稿的。为了使投射在原稿上的光线均匀分布,扫描仪中使用的是长条形光源。对 于黑白扫描仪,用户可以选择黑白颜色所对应电压的中间值作为阈值,凡低于阈值的电压 就为 0(黑色),反之为 1(白色)。而在灰度扫描仪中,每个象素有多个灰度层次。彩色扫 描仪的工作原理与灰度扫描仪的工作原理相似,不同之处在于彩色扫描仪要提取原稿中的 彩色信息。扫描仪的幅面有 A0,A1,A3,A4 等。扫描仪的分辨率是指在原稿的单位长度(英 寸)上取样的点数,单位是 dpi,常用的分辨率有 300-1000 dpi 之间。扫描图象的分辨率越 高,所需的存储空间就越大。现在多数扫描仪都提供了可选择分辨率的功能。对于复杂图 象,可选用较高的分辨率;对于较简单的图象,就选择较低的分辨率。 (2)扫描过程 扫描时,必须先进行扫描参数的设置,包括: a、扫描模式的设置,(分二值、灰度、百万种彩色),对地形图的扫描一般采用二值扫 描,或灰度扫描。对彩色航片或卫片采用百万种彩色扫描,对黑白航片或卫片采用 灰度扫描。 b、扫描分辨率的设置,根据扫描要求,对地形图的扫描一般采用 300dpi 或更高的分 辨率。 c、针对一些特殊的需要,还可以调整亮度、对比度、色调、GAMMA 曲线等。 d、设定扫描范围。 扫描参数设置完后,即可通过扫描获得某个地区的栅格数据。 通过扫描获得的是栅格数据,数据量比较大。如一张地形图采用 300dpi 灰度扫描其数 据量就有 20 兆左右。除此之外,扫描获得的数据还存在着噪声和中间色调像元的处理问题。 噪声是指不属于地图内容的斑点污渍和其它模糊不清的东西形成的像元灰度值。噪音范围 很广,没有简单有效的方法能加以完全消除,有的软件能去除一些小的脏点,但有些地图 内容如小数点等和小的脏点很难区分。对于中间色调像元,则可以通过选择合适的阈值选 用一些软件如 Photoshop 等来处理。 一般对获得的栅格数据还要进行一些后续处理如图象纠正、矢量化等。 扫描输入因其输入速度快、不受人为因素的影响、操作简单而越来越受到大家的欢迎, 再加之计算机运算速度、存储容量的提高和矢量化软件的踊跃出现,使得扫描输入已成为 图形数据输入的主要方法
第三节空间数据的编辑与处理 、误差或错误的检查与编辑 通过矢量数字化或扫描数字化所获取的原始空间数据,都不可避免的存在着错误或误 差,属性数据在建库输入时,也难免会存在错误,所以,对图形数据和属性数据进行一定 的检查、编辑是很有必要的。 图形数据和属性数据的误差主要包括以下几个方面: 1、空间数据的不完整或重复:主要包括空间点、线、面数据的丢失或重复、区域中心 点的遗漏、栅格数据矢量化时引起的断线等 2、空间数据位置的不准确:主要包括空间点位的不准确、线段过长或过短、线段的断 裂、相邻多边形结点的不重合等 3、空间数据的比例尺不准确 4、空间数据的变形 5、空间属性和数据连接有误 6、属性数据不完整; 为发现并有效消除误差,一般采用如下方法进行检查: 1、叠合比较法,是空间数据数字化正确与否的最佳检核方法,按与原图相同的比例尺 用把数字化的内容绘在透明材料上,然后与原图叠合在一起,在透光桌上仔细的观察和比 较。一般,对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来,对于空 间数据的位置不完整和不准确则须用粗笔把遗漏、位置错误的地方明显地标注出来。如果 数字化的范围比较大,分块数字化时,除检核一幅(块)图内的差错外还应检核已存入计算 机的其它图幅的接边情况 2、目视检査法,指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误 如图所示,包括线段过长或过短、多边形的重叠和裂口、线段的断裂等; 3、逻辑检査法,如根据数据拓扑一致性进行检验,将弧段连成多边形,进行数字化误 差的检査。有许多软件已能自动进行多边形结点的自动平差。另外,对属性数据的检查一 般也最先用这种方法,检査属性数据的值是否超过其取值范围。属性数据之间或属性数据 与地理实体之间是否有荒谬的组合 对于空间数据的不完整或位置的误差,主要是利用GIS的图形编辑功能,如删除(目标、 属性、坐标),修改(平移、拷贝、连接、分裂、合并、整饰),插入等进行处理。 对空间数据比例尺的不准确和变形,可以通过比例变换和纠正来处理
58 第三节 空间数据的编辑与处理 一、 误差或错误的检查与编辑 通过矢量数字化或扫描数字化所获取的原始空间数据,都不可避免的存在着错误或误 差,属性数据在建库输入时,也难免会存在错误,所以,对图形数据和属性数据进行一定 的检查、编辑是很有必要的。 图形数据和属性数据的误差主要包括以下几个方面: 1、空间数据的不完整或重复:主要包括空间点、线、面数据的丢失或重复、区域中心 点的遗漏、栅格数据矢量化时引起的断线等; 2、空间数据位置的不准确:主要包括空间点位的不准确、线段过长或过短、线段的断 裂、相邻多边形结点的不重合等; 3、空间数据的比例尺不准确; 4、空间数据的变形; 5、空间属性和数据连接有误; 6、属性数据不完整; 为发现并有效消除误差,一般采用如下方法进行检查: 1、叠合比较法,是空间数据数字化正确与否的最佳检核方法,按与原图相同的比例尺 用把数字化的内容绘在透明材料上,然后与原图叠合在一起,在透光桌上仔细的观察和比 较。一般,对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来,对于空 间数据的位置不完整和不准确则须用粗笔把遗漏、位置错误的地方明显地标注出来。如果 数字化的范围比较大,分块数字化时,除检核一幅(块)图内的差错外还应检核已存入计算 机的其它图幅的接边情况; 2、目视检查法,指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误, 如图 所示,包括线段过长或过短、多边形的重叠和裂口、线段的断裂等; 3、逻辑检查法,如根据数据拓扑一致性进行检验,将弧段连成多边形,进行数字化误 差的检查。有许多软件已能自动进行多边形结点的自动平差。另外,对属性数据的检查一 般也最先用这种方法,检查属性数据的值是否超过其取值范围。属性数据之间或属性数据 与地理实体之间是否有荒谬的组合。 对于空间数据的不完整或位置的误差,主要是利用 GIS 的图形编辑功能,如删除(目标、 属性、坐标),修改(平移、拷贝、连接、分裂、合并、整饰),插入等进行处理。 对空间数据比例尺的不准确和变形,可以通过比例变换和纠正来处理
、图象纠正 此处的图象主要指通过扫描得到的地形图和遥感影象。由于如下原因,使扫描得到的 地形图数据和遥感数据存在变形,必须加以纠正。 1、由于受地形图介质及存放条件等因素的影响,使地形图的实际尺寸发生变形; 2、在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影象没 被压紧、产生斜置或扫描参数的设置等因素都会使被扫入的地形图或遥感影象产生变形 直接影响扫描质量和精度 3、由于遥感影象本身就存在着几何变形; 4、由于所需地图图幅的投影与资料的投影不同,或需将遥感影象的中心投影或多中心 投影转换为正射投影等 5、由于扫描时,受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影象分成几块 扫描,这样会使地形图或遥感影象在拼接时难以保证精度 对扫描得到的图象进行纠正,主要是建立要纠正的图象与标准的地形图或地形图的理 论数值或纠正过的正射影象之间的变换关系,目前,主要的变换函数有:仿射变换、双线 性变换、平方变换、双平方变换、立方变换、四阶多项式变换等,具体采用哪一种,则要 根据纠正图象的变形情况、所在区域的地理特征及所选点数来决定。 以下,分别看一看地形图和遥感影象的纠正过程及具体步骤 1、地形图的纠正 对地形图的纠正,一般采用四点纠正法或逐网格纠正法 四点纠正法,一般是根据选定的数学变换函数,输入需纠正地形图的图幅行、列号 地形图的比例尺、图幅名称等,生成标准图廓,分别采集四个图廓控制点坐标来完成。 逐网格纠正法,是在四点纠正法不能满足精度要求的情况下采用的。这种方法和四点 纠正法的不同点就在于采样点数目的不同,它是逐方里网进行的,也就是说,对每一个方 里网,都要采点 具体采点时,一般要先采源点(需纠正的地形图),后采目标点(标准图廓),先采图 廓点和控制点,后采方里网点。 3、遥感影象的纠正 遥感影象的纠正,一般选用和遥感影象比例尺相近的地形图或正射影象图作为变换标 准,选用合适的变换函数,分别在要纠正的遥感影象和标准地形图或正射影象图上采集同 名地物点。 具体采点时,要先采源点(影像),后采目标点(地形图)。选点时,要注意选点的均 匀分布,点不能太多。如果在选点时没有注意点位的分布或点太多,这样不但不能保证精
59 二、图象纠正 此处的图象主要指通过扫描得到的地形图和遥感影象。由于如下原因,使扫描得到的 地形图数据和遥感数据存在变形,必须加以纠正。 1、由于受地形图介质及存放条件等因素的影响,使地形图的实际尺寸发生变形; 2、在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影象没 被压紧、产生斜置或扫描参数的设置等因素都会使被扫入的地形图或遥感影象产生变形, 直接影响扫描质量和精度; 3、由于遥感影象本身就存在着几何变形; 4、由于所需地图图幅的投影与资料的投影不同,或需将遥感影象的中心投影或多中心 投影转换为正射投影等。 5、由于扫描时,受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影象分成几块 扫描,这样会使地形图或遥感影象在拼接时难以保证精度。 对扫描得到的图象进行纠正,主要是建立要纠正的图象与标准的地形图或地形图的理 论数值或纠正过的正射影象之间的变换关系,目前,主要的变换函数有:仿射变换、双线 性变换、平方变换、双平方变换、立方变换、四阶多项式变换等,具体采用哪一种,则要 根据纠正图象的变形情况、所在区域的地理特征及所选点数来决定。 以下,分别看一看地形图和遥感影象的纠正过程及具体步骤: 1、地形图的纠正 对地形图的纠正,一般采用四点纠正法或逐网格纠正法。 四点纠正法,一般是根据选定的数学变换函数,输入需纠正地形图的图幅行、列号、 地形图的比例尺、图幅名称等,生成标准图廓,分别采集四个图廓控制点坐标来完成。 逐网格纠正法,是在四点纠正法不能满足精度要求的情况下采用的。这种方法和四点 纠正法的不同点就在于采样点数目的不同,它是逐方里网进行的,也就是说,对每一个方 里网,都要采点。 具体采点时,一般要先采源点(需纠正的地形图),后采目标点(标准图廓),先采图 廓点和控制点,后采方里网点。 3、遥感影象的纠正 遥感影象的纠正,一般选用和遥感影象比例尺相近的地形图或正射影象图作为变换标 准,选用合适的变换函数,分别在要纠正的遥感影象和标准地形图或正射影象图上采集同 名地物点。 具体采点时,要先采源点(影像),后采目标点(地形图)。选点时,要注意选点的均 匀分布,点不能太多。如果在选点时没有注意点位的分布或点太多,这样不但不能保证精
度,反而会使影象产生变形。另外选点时,点位应选由人工建筑构成的并且不会移动的地 物点,如渠或道路交叉点、桥梁等,尽量不要选河床易变动的河流交叉点,以免点的移位 影响配准精度 、数据格式的转换 数据格式的转换一般分为两大类:不同数据介质之间的转换,即将各种不同的源材料 信息如地图、照片、各种文字及表格转为计算机可以兼容的格式,主要采用数字化、扫描 键盘输入等方式,这在上一节中已经说明:第二类转换是数据结构之间的转换,而数据结 构之间的转化又包括同一数据结构不同组织形式间的转换和不同数据结构间的转换。 同一数据结构不同组织形式间的转换包括不同栅格记录形式之间的转换(如四叉树和 游程编码之间的转换)和不同矢量结构之间的转换(如索引式和DIME之间的转换)。这两 种转换方法要视具体的转换内容根据矢量和栅格数据编码的原理和方法来进行。 不同数据结构间的转换主要包括矢量到栅格数据的转换和栅格到矢量数据的转换两 种。具体的转换方法在第四章中已有详细说明 四、地图投影转换 当系统使用的数据取自不同地图投影的图幅时,需要将一种投影的数字化数据转换为 所需要投影的坐标数据。投影转换的方法可以采用 1、正解变换:通过建立一种投影变换为另一种投影的严密或近似的解析关系式,直 接由一种投影的数字化坐标x、y变换到另一种投影的直角坐标X、Y。 2、反解变换:即由一种投影的坐标反解出地理坐标(x、y→B、L),然后再将地理坐 标代入另一种投影的坐标公式中(B、L→X、Y),从而实现由一种投影的坐标到另一种投影 坐标的变换(x、y→X、Y) 3、数值变换:根据两种投影在变换区内的若干同名数字化点,采用插值法,或有限 差分法,最小二乘法、或有限元法,或待定系数法等,从而实现由一种投影的坐标到 种投影坐标的变换 目前,大多数GIS软件是采用正解变换法来完成不同投影之间的转换,并直接在GIS 软件中提供常见投影之间的转换 五、图象解译 遥感影象的信息,要进入GIS,很重要的一步就是图像解译:从图像中提取有用信息的 过程。 对图像进行解译,是一项涉及诸多内容的复杂过程。这些内容包括:研究地理区域的
60 度,反而会使影象产生变形。另外选点时,点位应选由人工建筑构成的并且不会移动的地 物点,如渠或道路交叉点、桥梁等,尽量不要选河床易变动的河流交叉点,以免点的移位 影响配准精度。 三、数据格式的转换 数据格式的转换一般分为两大类:不同数据介质之间的转换,即将各种不同的源材料 信息如地图、照片、各种文字及表格转为计算机可以兼容的格式,主要采用数字化、扫描、 键盘输入等方式,这在上一节中已经说明;第二类转换是数据结构之间的转换,而数据结 构之间的转化又包括同一数据结构不同组织形式间的转换和不同数据结构间的转换。 同一数据结构不同组织形式间的转换包括不同栅格记录形式之间的转换(如四叉树和 游程编码之间的转换)和不同矢量结构之间的转换(如索引式和 DIME 之间的转换)。这两 种转换方法要视具体的转换内容根据矢量和栅格数据编码的原理和方法来进行。 不同数据结构间的转换主要包括矢量到栅格数据的转换和栅格到矢量数据的转换两 种。具体的转换方法在第四章中已有详细说明。 四、地图投影转换 当系统使用的数据取自不同地图投影的图幅时,需要将一种投影的数字化数据转换为 所需要投影的坐标数据。投影转换的方法可以采用: 1、正解变换: 通过建立一种投影变换为另一种投影的严密或近似的解析关系式,直 接由一种投影的数字化坐标 x、y 变换到另一种投影的直角坐标 X、Y。 2、反解变换: 即由一种投影的坐标反解出地理坐标(x、y→B、L),然后再将地理坐 标代入另一种投影的坐标公式中(B、L→X、Y),从而实现由一种投影的坐标到另一种投影 坐标的变换(x、y→X、Y)。 3、数值变换: 根据两种投影在变换区内的若干同名数字化点,采用插值法,或有限 差分法,最小二乘法、或有限元法,或待定系数法等,从而实现由一种投影的坐标到另一 种投影坐标的变换。 目前,大多数 GIS 软件是采用正解变换法来完成不同投影之间的转换,并直接在 GIS 软件中提供常见投影之间的转换。 五、图象解译 遥感影象的信息,要进入GIS,很重要的一步就是图像解译:从图像中提取有用信息的 过程。 对图像进行解译,是一项涉及诸多内容的复杂过程。这些内容包括:研究地理区域的
一般知识;掌握影像分析的经验和技能;对影像特征的深入理解。有时,在图象解译之前, 还会对其进行图象增强处理 图像解译过程一般是建立在对图像及其解译区域进行系统研究的基础之上,具体包括 图象的成像原理、图象的成像时间、图象的解译标志、成像地区的地理特征、地图、植被、 气候学以及区域内有关人类活动的各种信息 遥感图象的解译标志很多,包括图象的色调或色彩、大小、形状、纹理、阴影、位置 及地物之间的相互关系等。色调被认为是最基本的因素,因为没有色调变化,物体就不能 被识别。大小、形状和纹理较复杂,需要进行个体特征的分析和解译。而阴影、类型、位 置和相互关系则最为复杂,涉及特征间的相关关系。 影像分析是一个不断重复的过程,其中要对各种地物类型的信息以及信息之间的相关 关系进行周密调査,收集资料、检验假说、作出解译并不断修正错误,才能最终得出正确 的结果。 遥感图象的解译有目视判读和计算机自动解译两种方法,其中,自动解译又可分为监 督分类和非监督分类两种。 六、图幅拼接 在相邻图幅的边缘部分,由于原图本身的数字化误差,使得同一实体的线段或弧段的 坐标数据不能相互衔接,或是由于坐标系统、编码方式等不统一,需进行图幅数据边缘匹 配处理。 图幅的拼接总是在相邻两图幅之间进行的。要将相邻两图幅之间的数据集中起来,就 要求相同实体的线段或弧的坐标数据相互衔接,也要求同一实体的属性码相同,因此必须 进行图幅数据边缘匹配处理。具体步骤如下 1、逻辑一致性的处理 由于人工操作的失误,两个相邻图幅的空间数据库在接合处可能出现逻辑裂隙,如 个多边形在一幅图层中具有属性A,而在另一幅图层中属性为B。此时,必须使用交互编辑 的方法,使两相邻图斑的属性相同,取得逻辑一致性 2、识别和检索相邻图幅 将待拼接的图幅数据按图幅进行编号,编号有2位,其中十位数指示图幅的横向顺序, 个位数指示纵向顺序,并记录图幅的长宽标准尺寸。因此,当进行横向图幅拼接时,总是 将十位数编号相同的图幅数据收集在一起;进行纵向图幅拼接时,是将个位数编号相同的 图幅数据收集在一起。其次,图幅数据的边缘匹配处理主要是针对跨越相邻图幅的线段或 弧的,为了减少数据容量,提高处理速度,一般只提取图幅边界2cm范围内的数据作为匹
61 一般知识;掌握影像分析的经验和技能;对影像特征的深入理解。有时,在图象解译之前, 还会对其进行图象增强处理。 图像解译过程一般是建立在对图像及其解译区域进行系统研究的基础之上,具体包括 图象的成像原理、图象的成像时间、图象的解译标志、成像地区的地理特征、地图、植被、 气候学以及区域内有关人类活动的各种信息。 遥感图象的解译标志很多,包括图象的色调或色彩、大小、形状、纹理、阴影、位置 及地物之间的相互关系等。色调被认为是最基本的因素,因为没有色调变化,物体就不能 被识别。大小、形状和纹理较复杂,需要进行个体特征的分析和解译。而阴影、类型、位 置和相互关系则最为复杂,涉及特征间的相关关系。 影像分析是一个不断重复的过程,其中要对各种地物类型的信息以及信息之间的相关 关系进行周密调查,收集资料、检验假说、作出解译并不断修正错误,才能最终得出正确 的结果。 遥感图象的解译有目视判读和计算机自动解译两种方法,其中,自动解译又可分为监 督分类和非监督分类两种。 六、图幅拼接 在相邻图幅的边缘部分,由于原图本身的数字化误差,使得同一实体的线段或弧段的 坐标数据不能相互衔接,或是由于坐标系统、编码方式等不统一,需进行图幅数据边缘匹 配处理。 图幅的拼接总是在相邻两图幅之间进行的。要将相邻两图幅之间的数据集中起来,就 要求相同实体的线段或弧的坐标数据相互衔接,也要求同一实体的属性码相同,因此必须 进行图幅数据边缘匹配处理。具体步骤如下: 1、逻辑一致性的处理 由于人工操作的失误,两个相邻图幅的空间数据库在接合处可能出现逻辑裂隙,如一 个多边形在一幅图层中具有属性 A,而在另一幅图层中属性为 B。此时,必须使用交互编辑 的方法,使两相邻图斑的属性相同,取得逻辑一致性。 2、 识别和检索相邻图幅 将待拼接的图幅数据按图幅进行编号,编号有 2 位,其中十位数指示图幅的横向顺序, 个位数指示纵向顺序,并记录图幅的长宽标准尺寸。因此,当进行横向图幅拼接时,总是 将十位数编号相同的图幅数据收集在一起;进行纵向图幅拼接时,是将个位数编号相同的 图幅数据收集在一起。其次,图幅数据的边缘匹配处理主要是针对跨越相邻图幅的线段或 弧的,为了减少数据容量,提高处理速度,一般只提取图幅边界 2cm 范围内的数据作为匹
配和处理的目标。同时要求,图幅内空间实体的坐标数据已经进行过投影转换 3、相邻图幅边界点坐标数据的匹配 相邻图幅边界点坐标数据的匹配采用追踪拼接法。追踪拼接有四种情况,只要符合下 列条件,两条线段或弧段即可匹配衔接:相邻图幅边界两条线段或弧段的左右码各自相同 或相反;相邻图幅同名边界点坐标在某一允许值范围内(如小于0.5mm 匹配衔接时是以一条弧或线段作为处理的单元,因此,当边界点位于两个结点之间时, 须分别取出相关的两个结点,然后按照结点之间线段方向一致性的原则进行数据的记录和 存储 4、相同属性多边形公共边界的删除 当图幅内图形数据完成拼接后,相邻图斑会有相同属性。此时,应将相同属性的两个 或多个相邻图斑组合成一个图斑,即消除公共边界,并对共同属性进行合并 多边形公共界线的删除,可以通过构成每一面域的线段坐标链,删去其中共同的线段 然后重新建立合并多边形的线段链表。 对于多边形的属性表,除多边形的面积和周长需重新计算外,其余属性保留其中之 图斑的属性即可。 第四节空间数据质量及其精度分析 、空间数据质量的概念 1、空间数据质量 空间位置、专题特征以及时间是表达现实世界空间变化的三个基本要素。空间数据是 有关空间位置、专题特征以及时间信息的符号记录。而数据质量则是空间数据在表达这三 个基本要素时,所能够达到的准确性、一致性、完整性,以及它们三者之间统一性的程度。 空间数据是对现实世界中空间特征和过程的抽象表达。由于现实世界的复杂性和模糊 性,以及人类认识和表达能力的局限性,这种抽象表达总是不可能完全达到真值的,而只 能在一定程度上接近真值。从这种意义上讲,数据质量发生问题是不可避免的:另一方面, 对空间数据的处理也会导致出现一定的质量问题:例如,在某些应用中,用户可能根据需 要来对数据进行一定的删减或扩充,这对数据记录本身来说也是一种误差。 因此,空间数据质量的好坏是一个相对概念,并具有一定程度的针对性。尽管如此, 我们仍可以脱离开具体的应用,从空间数据存在的客观规律性出发来对空间数据的质量进 行评价和控制
62 配和处理的目标。同时要求,图幅内空间实体的坐标数据已经进行过投影转换。 3、相邻图幅边界点坐标数据的匹配 相邻图幅边界点坐标数据的匹配采用追踪拼接法。追踪拼接有四种情况,只要符合下 列条件,两条线段或弧段即可匹配衔接:相邻图幅边界两条线段或弧段的左右码各自相同 或相反;相邻图幅同名边界点坐标在某一允许值范围内(如小于 O.5mm)。 匹配衔接时是以一条弧或线段作为处理的单元,因此,当边界点位于两个结点之间时, 须分别取出相关的两个结点,然后按照结点之间线段方向一致性的原则进行数据的记录和 存储。 4、相同属性多边形公共边界的删除 当图幅内图形数据完成拼接后,相邻图斑会有相同属性。此时,应将相同属性的两个 或多个相邻图斑组合成一个图斑,即消除公共边界,并对共同属性进行合并。 多边形公共界线的删除,可以通过构成每一面域的线段坐标链,删去其中共同的线段, 然后重新建立合并多边形的线段链表。 对于多边形的属性表,除多边形的面积和周长需重新计算外,其余属性保留其中之一 图斑的属性即可。 第四节 空间数据质量及其精度分析 一、 空间数据质量的概念 1、空间数据质量 空间位置、专题特征以及时间是表达现实世界空间变化的三个基本要素。空间数据是 有关空间位置、专题特征以及时间信息的符号记录。而数据质量则是空间数据在表达这三 个基本要素时,所能够达到的准确性、一致性、完整性,以及它们三者之间统一性的程度。 空间数据是对现实世界中空间特征和过程的抽象表达。由于现实世界的复杂性和模糊 性,以及人类认识和表达能力的局限性,这种抽象表达总是不可能完全达到真值的,而只 能在一定程度上接近真值。从这种意义上讲,数据质量发生问题是不可避免的;另一方面, 对空间数据的处理也会导致出现一定的质量问题;例如,在某些应用中,用户可能根据需 要来对数据进行一定的删减或扩充,这对数据记录本身来说也是一种误差。 因此,空间数据质量的好坏是一个相对概念,并具有一定程度的针对性。尽管如此, 我们仍可以脱离开具体的应用,从空间数据存在的客观规律性出发来对空间数据的质量进 行评价和控制