地理学中的第一条法则,任何事物都与其它事情相关,但是距离近的事物比距高 远的关系更大 aldo tobler 第八章空间分析 导读:空间分析源于60年代地理和区域科学的计量革命,在开始阶段,主要是应用 定量(主要是统计)分析手段用于分析点、线、面的空间分布模式。后来更多的是 强调地理空间本身的特征、空间决策过程和复杂空间系统的时空演化过程分析。实 际上自有地图以来,人们就始终在自觉或不自觉地迸行着各种类型的空间分析。如 在地图上量测地理要素之间的距离、方位、面积,乃至利用地图进行战术研究和战 略决策等,都是人们利用地图进行空间分析的实例,而后者实质上已属较高层次上 的空间分析 地理信息系统集成了多学科的最新技术,如关系数据库管理,高效图形算法,插值, 区划和网络分析,为空间分析提供了强大的工具,使得过去复杂困难的高级空间分 析任务变得简单易行。目前绝大多数地理信息系统软件都有空间分析功能。空间分 析早已成为地理信息系统的核心功能之一,它特有的对地理信息(特别是隐含信息) 的提取、表现和传输功能,是地理信息系统区别于般信息系统的主要功能特征。 空间分析是对分析空间数据有关技术的统称。根据作用的数据性质不同,可以分为 (1)基于空间图形数据的分析运算;(2)基于非空间属性的数据运算;(3)空间和 非空间数据的联合运算。空间分析赖以进行的基础是地理空间数据库,其运用的手 段包括各种几何的逻辑运算、数理统计分析,代数运算等数学手段,最终的目的是 解决人们所涉及到地理空间的实际问题,提取和传输地理空间信息,特别是隐含信 息,以辅助决策 本章介绍GS中实现空间分析的基本功能,包括空间查询与量算,缓冲区分析、叠
地理学中的第一条法则,任何事物都与其它事情相关,但是距离近的事物比距离 远的关系更大。 Waldo Tobler 第八章 空间分析 导读:空间分析源于 60 年代地理和区域科学的计量革命,在开始阶段,主要是应用 定量(主要是统计)分析手段用于分析点、线、面的空间分布模式。后来更多的是 强调地理空间本身的特征、空间决策过程和复杂空间系统的时空演化过程分析。实 际上自有地图以来,人们就始终在自觉或不自觉地进行着各种类型的空间分析。如 在地图上量测地理要素之间的距离、方位、面积,乃至利用地图进行战术研究和战 略决策等,都是人们利用地图进行空间分析的实例,而后者实质上已属较高层次上 的空间分析。 地理信息系统集成了多学科的最新技术,如关系数据库管理,高效图形算法,插值, 区划和网络分析,为空间分析提供了强大的工具,使得过去复杂困难的高级空间分 析任务变得简单易行。目前绝大多数地理信息系统软件都有空间分析功能。空间分 析早已成为地理信息系统的核心功能之一,它特有的对地理信息(特别是隐含信息) 的提取、表现和传输功能,是地理信息系统区别于一般信息系统的主要功能特征。 空间分析是对分析空间数据有关技术的统称。根据作用的数据性质不同,可以分为: (1)基于空间图形数据的分析运算;(2)基于非空间属性的数据运算;(3)空间和 非空间数据的联合运算。空间分析赖以进行的基础是地理空间数据库,其运用的手 段包括各种几何的逻辑运算、数理统计分析,代数运算等数学手段,最终的目的是 解决人们所涉及到地理空间的实际问题,提取和传输地理空间信息,特别是隐含信 息,以辅助决策。 本章介绍 GIS 中实现空间分析的基本功能,包括空间查询与量算,缓冲区分析、叠
加分析、路径分析、空间插值、统计分类分析等,并描述了相关的算法,以及其中 的计算公式 1.空间查询与量算 查询和定位空间对象,并对空间对象进行量算是地理信息系统的基本功能之一,它是地 理信息系统进行高层次分析的基础。在地理信息系统中,为进行高层次分析,往往需要查询 定位空间对象,并用一些简单的量测值对地理分布或现象进行描述,如长度,面积,距离, 形状等。实际上,空间分析首先始于空间查询和量算,它是空间分析的定量基础 1.1空间查询 图形与属性互查是最常用的查询,主要有两类:第一类是按属性信息的要求来查询定位 空间位置,称为“属性查图形”。如在中国行政区划图上查询人口大于4000万且城市人口大 于1000万的省有哪些,这和一般非空间的关系数据库的SQL查询没有区别,查询到结果后 再利用图形和属性的对应关系,进一步在图上用指定的显示方式将结果定位绘出。第二类是 根据对象的空间位置查询有关属性信息,称为“图形查属性”。如一般地理信息系统软件都 提供一个“INFO”工具,让用户利用光标,用点选、画线、矩形、圆、不规则多边形等工 具选中地物,并显示出所查询对象的属性列表,可进行有关统计分析。该查询通常分为两步, 首先借助空间索引,在地理信息系统数据库中快速检索出被选空间实体,然后根据空间实体 与属性的连接关系即可得到所查询空间实体的属性列表。 在大多数GS中,提供的空间查询方式有: 1)基于空间关系查询 空间实体间存在着多种空间关系,包括拓扑、顺序、距离、方位等关系。通过空间关系 查询和定位空间实体是地理信息系统不同于一般数据库系统的功能之一。如查询满足下列条 件的城市: 在京沪线的东部 距离京沪线不超过50公里 城市人口大于100万 城市选择区域是特定的多边形; 整个查询计算涉及了空间顺序方位关系(京沪线东部),空间距离关系(距离京沪线不超过 50公里),空间拓扑关系(使选择区域是特定的多边形),甚至还有属性信息查询(城市人 口大于100万)。 简单的面、线、点相互关系的查询包括: 面面查询,如与某个多边形相邻的多边形有哪些。 面线查询,如某个多边形的边界有哪些线。 ●面点查询,如某个多边形内有哪些点状地物 线面查询,如某条线经过(穿过)的多边形有哪些,某条链的左、右多边形是哪些 线线查询,如与某条河流相连的支流有哪些,某条道路跨过哪些河流 线点查询,如某条道路上有哪些桥梁,某条输电线上有哪些变电站。 点面查询,如某个点落在哪个多边形内
加分析、路径分析、空间插值、统计分类分析等,并描述了相关的算法,以及其中 的计算公式。 1.空间查询与量算 查询和定位空间对象,并对空间对象进行量算是地理信息系统的基本功能之一,它是地 理信息系统进行高层次分析的基础。在地理信息系统中,为进行高层次分析,往往需要查询 定位空间对象,并用一些简单的量测值对地理分布或现象进行描述,如长度,面积,距离, 形状等。实际上,空间分析首先始于空间查询和量算,它是空间分析的定量基础。 1.1 空间查询 图形与属性互查是最常用的查询,主要有两类:第一类是按属性信息的要求来查询定位 空间位置,称为“属性查图形”。如在中国行政区划图上查询人口大于 4000 万且城市人口大 于 1000 万的省有哪些,这和一般非空间的关系数据库的 SQL 查询没有区别,查询到结果后, 再利用图形和属性的对应关系,进一步在图上用指定的显示方式将结果定位绘出。第二类是 根据对象的空间位置查询有关属性信息,称为“图形查属性”。如一般地理信息系统软件都 提供一个“INFO”工具,让用户利用光标,用点选、画线、矩形、圆、不规则多边形等工 具选中地物,并显示出所查询对象的属性列表,可进行有关统计分析。该查询通常分为两步, 首先借助空间索引,在地理信息系统数据库中快速检索出被选空间实体,然后根据空间实体 与属性的连接关系即可得到所查询空间实体的属性列表。 在大多数 GIS 中,提供的空间查询方式有: 1)基于空间关系查询 空间实体间存在着多种空间关系,包括拓扑、顺序、距离、方位等关系。通过空间关系 查询和定位空间实体是地理信息系统不同于一般数据库系统的功能之一。如查询满足下列条 件的城市: ⚫ 在京沪线的东部 ⚫ 距离京沪线不超过 50 公里 ⚫ 城市人口大于 100 万 ⚫ 城市选择区域是特定的多边形; 整个查询计算涉及了空间顺序方位关系(京沪线东部),空间距离关系(距离京沪线不超过 50 公里),空间拓扑关系(使选择区域是特定的多边形),甚至还有属性信息查询(城市人 口大于 100 万)。 简单的面、线、点相互关系的查询包括: ⚫ 面面查询,如与某个多边形相邻的多边形有哪些。 ⚫ 面线查询,如某个多边形的边界有哪些线。 ⚫ 面点查询,如某个多边形内有哪些点状地物。 ⚫ 线面查询,如某条线经过(穿过)的多边形有哪些,某条链的左、右多边形是哪些。 ⚫ 线线查询,如与某条河流相连的支流有哪些,某条道路跨过哪些河流。 ⚫ 线点查询,如某条道路上有哪些桥梁,某条输电线上有哪些变电站。 ⚫ 点面查询,如某个点落在哪个多边形内
●点线查询,如某个结点由哪些线相交而成。 2)基于空间关系和属性特征查询 传统的关系数据库的标准SQL并不能处理空间查询,这是由于关系数据库技术的弱点 造成的,对于GS而言,需要对SoL_进行扩展。对于传统的SQL,要实现空间操作,需要 将SQL命令嵌入一种编程语言中,如C语言;而新的SQL允许用户定义自己的操作,并嵌 入到SQL命令中。 3)地址匹配查询 根据街道的地址来査询事物的空间位置和属性信息是地理信息系统特有的一种查询功 能,这种査询利用地理编码,输入街道的门牌号码,就可知道大致的位置和所在的街区。它 对空间分布的社会、经济调查和统计很有帮助,只要在调查表中添了地址,地理信息系统可 以自动地从空间位置的角度来统计分析各种经济社会调查资料。另外这种查询也经常用于公 用事业管理,事故分析等方面,如邮政、通讯、供水、供电、治安、消防、医疗等领域。 1.2空间量算 2.1几何量算 几何量算对不同的点、线、面地物有不同的含义 ●点状地物(0维):坐标 线状地物(1维):长度,曲率,方向 。你找地物(3推积,曲等 一般的GIS软件都具有对点、线、面状地物的几何量算功能,或者是针对矢量数据结 构,或者是针对栅格数据结构的空间数据 1)线的长度计算 线状地物对象最基本的形态参数之一是长度。在矢量数据结构下,线表示为点对坐标 (X,Y)或(X,Y,Z)的序列,在不考虑比例尺情况下,线长度的计算公式为: x1-x) 对于复合线状地物对象,则需要在对诸分支曲线求长度后,再求其长度总和。 通过离散坐标点对串来表达线对象,选择反映曲线形状的选点方案非常重要,往往由于 选点方案不同,会带来长度计算的不同精度问题。为提高计算精度,增加点的数目,会对数 据获取、管理与分析带来额外的负担,折中的选点方案是在曲线的拐弯处加大点的数目,在 平直段减少点数,以达到计算允许精度要求 在栅格数据结构里,线状地物的长度就是累加地物骨架线通过的格网数目,骨架线通常 采用8方向连接,当连接方向为对角线方向时,还要乘上2 2)面状地物的面积 面积是面状地物最基本的参数。在矢量结构下,面状地物以其轮廓边界弧段构成的多边 形表示的。对于没有空洞的简单多边形,假设有N个顶点,其面积计算公式为: x+1y)+(xy1
⚫ 点线查询,如某个结点由哪些线相交而成。 2)基于空间关系和属性特征查询 传统的关系数据库的标准 SQL 并不能处理空间查询,这是由于关系数据库技术的弱点 造成的,对于 GIS 而言,需要对 SQL 进行扩展。对于传统的 SQL,要实现空间操作,需要 将 SQL 命令嵌入一种编程语言中,如 C 语言;而新的 SQL 允许用户定义自己的操作,并嵌 入到 SQL 命令中。 3)地址匹配查询 根据街道的地址来查询事物的空间位置和属性信息是地理信息系统特有的一种查询功 能,这种查询利用地理编码,输入街道的门牌号码,就可知道大致的位置和所在的街区。它 对空间分布的社会、经济调查和统计很有帮助,只要在调查表中添了地址,地理信息系统可 以自动地从空间位置的角度来统计分析各种经济社会调查资料。另外这种查询也经常用于公 用事业管理,事故分析等方面,如邮政、通讯、供水、供电、治安、消防、医疗等领域。 1.2 空间量算 1.2.1 几何量算 几何量算对不同的点、线、面地物有不同的含义: ⚫ 点状地物(0 维):坐标; ⚫ 线状地物(1 维):长度,曲率,方向; ⚫ 面状地物(2 维):面积,周长,形状,曲率等; ⚫ 体状地物(3 维):体积,表面积等。 一般的 GIS 软件都具有对点、线、面状地物的几何量算功能,或者是针对矢量数据结 构,或者是针对栅格数据结构的空间数据。 1)线的长度计算 线状地物对象最基本的形态参数之一是长度。在矢量数据结构下,线表示为点对坐标 (X,Y)或(X,Y,Z)的序列,在不考虑比例尺情况下,线长度的计算公式为: ( ) ( ) ( ) − = = = + − + + − + + − = 1 0 1 2 1 2 1 2 1 2 1 n i n i i i i i i i i L X X Y Y Z Z l 对于复合线状地物对象,则需要在对诸分支曲线求长度后,再求其长度总和。 通过离散坐标点对串来表达线对象,选择反映曲线形状的选点方案非常重要,往往由于 选点方案不同,会带来长度计算的不同精度问题。为提高计算精度,增加点的数目,会对数 据获取、管理与分析带来额外的负担,折中的选点方案是在曲线的拐弯处加大点的数目,在 平直段减少点数,以达到计算允许精度要求。 在栅格数据结构里,线状地物的长度就是累加地物骨架线通过的格网数目,骨架线通常 采用 8 方向连接,当连接方向为对角线方向时,还要乘上 2 。 2)面状地物的面积 面积是面状地物最基本的参数。在矢量结构下,面状地物以其轮廓边界弧段构成的多边 形表示的。对于没有空洞的简单多边形,假设有 N 个顶点,其面积计算公式为: ( ) ( ) = − + − − = + + N N N i S xi yi xi yi x y1 x1 y 2 1 1 1 2 1
所采用的是几何交叉处理方法,即沿多边形的每个顶点作垂直与X轴的垂线,然后计算每 条边、它的两条垂线及这两条垂线所截得X轴部分所包围的面积,所求出的面积的代数和, 即为多边形面积。对于有孔或内岛的多边形,可分别计算外多边形与内岛面积,其差值为原 多边形面积。此方法亦适合于体积的计算 对于栅格结构,多边形面积计算就是统计具有相冋属性值的格网数目。但对计算破碎多 边形的面积有些特殊,可能需要计算某一个特定多边形的面积,必须进行再分类,将每个多 边形进行分割赋给单独的属性值,之后再进行统计 1.2.2形状量算 面状地物形状量测的两个基本考虑:空间一致性问题,即有孔多边形和破碎多边形的处 理;多边形边界特征描述问题 度量空间一致性最常用的指标是欧拉函数,用来计算多边形的破碎程度和孔的数目。欧 拉函数的结果是一个数,称为欧拉数。欧拉函数的计算公式为: 欧拉数=(孔数)-(碎片数1) 图8-1表示了多边形的三种可能的情形。 欧控数=4 欧数=3 二(: 欧拉数=3 图8-1:欧拉数 对于图(a),欧拉数=4-(1-1)=4或欧拉数=4-0=4;对于图(b)欧拉数=4(2-1)=3或欧拉数 1=3:图(c)欧拉数=5-(3-1)=3 关于多边形边界描述的问题,由于面状地物的外观是复杂多变的,很难找到一个准确的 指标进行描述。最常用的指标包括多边形长、短轴之比,周长面积比,面积长度比等。其中 绝大多数指标是基于面积和周长的。通常认为圆形地物既非紧凑型也非膨胀型,则可定义其 形状系数r为: 其中P为地物周长,A为面积。如果r1为膨胀型 1.2.3质心量算 质心是描述地理对象空间分布的一个重要指标。例如要得到一个全国的人口分布等值线 图,而人口数据只能到县级,所以必须在每个县域里定义一个点作为质心,代表该县的数值, 然后进行插值计算全国人口等值线。质心通常定义为一个多边形或面的几何中心,当多边形 比较简单,比如矩形,计算很容易。但当多边形形状复杂时,计算也更加复杂 在某些情况下,质心描述的是分布中心,而不是绝对几何中心。同样以全国人口为例,当某
所采用的是几何交叉处理方法,即沿多边形的每个顶点作垂直与 X 轴的垂线,然后计算每 条边、它的两条垂线及这两条垂线所截得 X 轴部分所包围的面积,所求出的面积的代数和, 即为多边形面积。对于有孔或内岛的多边形,可分别计算外多边形与内岛面积,其差值为原 多边形面积。此方法亦适合于体积的计算。 对于栅格结构,多边形面积计算就是统计具有相同属性值的格网数目。但对计算破碎多 边形的面积有些特殊,可能需要计算某一个特定多边形的面积,必须进行再分类,将每个多 边形进行分割赋给单独的属性值,之后再进行统计。 1.2.2 形状量算 面状地物形状量测的两个基本考虑:空间一致性问题,即有孔多边形和破碎多边形的处 理;多边形边界特征描述问题。 度量空间一致性最常用的指标是欧拉函数,用来计算多边形的破碎程度和孔的数目。欧 拉函数的结果是一个数,称为欧拉数。欧拉函数的计算公式为: 欧拉数=(孔数)-(碎片数-1) 图 8-1 表示了多边形的三种可能的情形。 图 8-1:欧拉数 对于图(a),欧拉数=4-(1-1)=4 或欧拉数=4-0=4;对于图(b)欧拉数=4-(2-1)=3 或欧拉数 =4-1=3;图(c)欧拉数=5-(3-1)=3。 关于多边形边界描述的问题,由于面状地物的外观是复杂多变的,很难找到一个准确的 指标进行描述。最常用的指标包括多边形长、短轴之比,周长面积比,面积长度比等。其中 绝大多数指标是基于面积和周长的。通常认为圆形地物既非紧凑型也非膨胀型,则可定义其 形状系数 r 为: A P r = 2 其中 P 为地物周长,A 为面积。如果 r1 为膨胀型。 1.2.3 质心量算 质心是描述地理对象空间分布的一个重要指标。例如要得到一个全国的人口分布等值线 图,而人口数据只能到县级,所以必须在每个县域里定义一个点作为质心,代表该县的数值, 然后进行插值计算全国人口等值线。质心通常定义为一个多边形或面的几何中心,当多边形 比较简单,比如矩形,计算很容易。但当多边形形状复杂时,计算也更加复杂。 在某些情况下,质心描述的是分布中心,而不是绝对几何中心。同样以全国人口为例,当某
个县绝大部分人口明显集中于一侧时,可以把质心放在分布中心上,这种质心称为平均中心 或重心。如果考虑其它一些因素的话,可以赋予权重系数,称为加权平均中心。计算公式是 WX 其中,W为第i个离散目标物权重,X,Y为第i个离散目标物的坐标 质心量测经常用于宏观经济分析和市场区位选择,还可以跟踪某些地理分布的变化,如 人口变迁,土地类型变化等。 1.2.4距离量算 “距离”是人们日常生活中经常涉及到的概念,它描述了两个事物或实体之间的远近程 度。最常用的距离概念是欧氏距离,无论是矢量结构,还是栅格结构都很容易实现。在GIS 中,距离通常是两个地点之间的计算,但有时人们想知道一个地点到所有其它地点的距离 这时得到的距离是一个距离表面。如果一区域中所有的性质与方向无关,则称为各向同性区 域。以旅行时间为例,如果从某一点出发,到另一点的所耗费的时间只与两点之间的欧氏距 离成正比,则从一固定点出发,旅行特定时间后所能达到的点必然组成一个等时圆。而现实 生活中,旅行所耗费的时间不只与欧氏距离成正比,还与路况、运输工具性能等有关,从固 定点出发,旅行特定时间后所能到达的点则在各个方向上是不同距离的,形成各向异性距离 表面。(图8-2) 高阻力 低阻力 (各向同性表面) 简单距离 耗费距离 图8-2:各向同性和各向异性的距离表面 考虑到阻力影响,计算的距离称为耗费距离。物质在空间中移动总要花费一些代价,如 资金、时间等。阻力越大耗费也越大。相应的通过耗费距离得到的距离表面称为阻力表面或 耗费表面,其属性值代表一耗费或阻力大小。可以根据阻力表面计算最小耗费距离。 对于描述点、线、面坐标的矢量结构,也有一系列的不同于欧氏距离的概念。欧氏距 通常用于计算两点的直线距离 d=x-x)+(y-y) 当有障碍或阻力存在时,两点之间的距离就不能用直线距离,计算非标准欧氏距离的
个县绝大部分人口明显集中于一侧时,可以把质心放在分布中心上,这种质心称为平均中心 或重心。如果考虑其它一些因素的话,可以赋予权重系数,称为加权平均中心。计算公式是: = i i i i i G W W X X = i i i i i G W W Y Y 其中,Wi 为第 i 个离散目标物权重,Xi,Yi 为第 i 个离散目标物的坐标。 质心量测经常用于宏观经济分析和市场区位选择,还可以跟踪某些地理分布的变化,如 人口变迁,土地类型变化等。 1.2.4 距离量算 “距离”是人们日常生活中经常涉及到的概念,它描述了两个事物或实体之间的远近程 度。最常用的距离概念是欧氏距离,无论是矢量结构,还是栅格结构都很容易实现。在 GIS 中,距离通常是两个地点之间的计算,但有时人们想知道一个地点到所有其它地点的距离, 这时得到的距离是一个距离表面。如果一区域中所有的性质与方向无关,则称为各向同性区 域。以旅行时间为例,如果从某一点出发,到另一点的所耗费的时间只与两点之间的欧氏距 离成正比,则从一固定点出发,旅行特定时间后所能达到的点必然组成一个等时圆。而现实 生活中,旅行所耗费的时间不只与欧氏距离成正比,还与路况、运输工具性能等有关,从固 定点出发,旅行特定时间后所能到达的点则在各个方向上是不同距离的,形成各向异性距离 表面。(图 8-2) (各向同性表面) 简单距离 耗费距离 高阻力 低阻力 图 8-2:各向同性和各向异性的距离表面 考虑到阻力影响,计算的距离称为耗费距离。物质在空间中移动总要花费一些代价,如 资金、时间等。阻力越大耗费也越大。相应的通过耗费距离得到的距离表面称为阻力表面或 耗费表面,其属性值代表一耗费或阻力大小。可以根据阻力表面计算最小耗费距离。 对于描述点、线、面坐标的矢量结构,也有一系列的不同于欧氏距离的概念。欧氏距离 通常用于计算两点的直线距离: ( ) ( ) 2 2 d = Xi − X j + Yi −Yj 当有障碍或阻力存在时,两点之间的距离就不能用直线距离,计算非标准欧氏距离的一
般公式为: d=(x-x)+(rr 当k=2时,就是欧氏距离计算公式。当k=1时,得到的距离称为曼哈顿距离。欧氏距 离、曼哈顿距离和非欧氏距离的计算如图8-3所示 欧式距离 -X,)+(-,) 曼哈顿距离 x-xI+r-Y 非欧式距离 d 6+ )of 图8-3:欧氏距离、曼哈顿距离和一种非欧氏距离 2.空间变换 地理信息系统通常是按有一定意义的图层和相应的属性建立空间数据库的。为了满足特 定空间分析的需要,需对原始图层及其属性进行一系列的逻辑或代数运算,以产生新的具有 特殊意义的地理图层及其属性,这个过程称为空间变换。空间变换可以基于单个图层进行, 也可以对多个图层,本章将空间变换仅限于对单个图层的操作或计算,基于多图层的操作, 将在叠加分析里讲述 地理信息系统中空间数据可分为矢量和栅格两种数据结构。由于矢量结构中包含了大量 的拓扑信息,数据组织复杂,使得空间变换十分繁琐。而栅格结构简单规则,空间变换比较 容易。另外基于矢量结构的空间变换,对于单个图层意义不大,生成新图层时往往需要多个 图层的信息,在多图层叠加分析中意义很大 基于栅格结构的空间变换可分为三种方式:(1)单点变换:(2)邻域变换;(3)区域变 换 单点变换只考虑单个点的属性值进行运算,假定独立单元的变换不依赖于其邻点上属性 的影响,也不受区域内一般特征的影响。单点变换最常见的函数有加、减、乘、除等代数运 算:与、并、非、异或等逻辑运算:大于、小于等比较运算:指数函数,对数函数、三角函 数等。其得到的新图层可与原图层属性意义完全不同
般公式为: ( ) ( ) k k i j k d Xi X j Y Y 1 = − + − 当 k=2 时,就是欧氏距离计算公式。当 k=1 时,得到的距离称为曼哈顿距离。欧氏距 离、曼哈顿距离和非欧氏距离的计算如图 8-3 所示。 (Xi, Yi ) (Xj, Yj ) ( ) ( ) 2 2 Xi X j Yi Yj d = − + − Xi X j Yi Yj d = − + − ( ) ( ) 1 0.6 0.6 0.6 i j i j d = X − X + Y − Y 欧式距离 曼哈顿距离 非欧式距离 图 8-3:欧氏距离、曼哈顿距离和一种非欧氏距离 2.空间变换 地理信息系统通常是按有一定意义的图层和相应的属性建立空间数据库的。为了满足特 定空间分析的需要,需对原始图层及其属性进行一系列的逻辑或代数运算,以产生新的具有 特殊意义的地理图层及其属性,这个过程称为空间变换。空间变换可以基于单个图层进行, 也可以对多个图层,本章将空间变换仅限于对单个图层的操作或计算,基于多图层的操作, 将在叠加分析里讲述。 地理信息系统中空间数据可分为矢量和栅格两种数据结构。由于矢量结构中包含了大量 的拓扑信息,数据组织复杂,使得空间变换十分繁琐。而栅格结构简单规则,空间变换比较 容易。另外基于矢量结构的空间变换,对于单个图层意义不大,生成新图层时往往需要多个 图层的信息,在多图层叠加分析中意义很大。 基于栅格结构的空间变换可分为三种方式:(1)单点变换;(2)邻域变换;(3)区域变 换。 单点变换只考虑单个点的属性值进行运算,假定独立单元的变换不依赖于其邻点上属性 的影响,也不受区域内一般特征的影响。单点变换最常见的函数有加、减、乘、除等代数运 算;与、并、非、异或等逻辑运算;大于、小于等比较运算;指数函数,对数函数、三角函 数等。其得到的新图层可与原图层属性意义完全不同
邻域变换是指在计算新图层图元值时,不仅考虑原始图层上相应图元本身的值,而且还 要考虑与该图元有邻域关联的其它图元值的影响。这种关联可以是直接的几何关联,也可能 是间接的几何关联。常见的函数有平滑、离散点搜索、连续表面描述(坡度、坡向、可视域 分析)、点在多边形中的判断等。 区域变换是指在计算新图层属性值时,要考虑整个区域的属性值,即通过一个函数对某 一区域内的所有值进行综合,然后计算新属性值。常见的函数有求区域平均值、众数,极值 求和、归组、整体插值等方法。 3.再分类 通过分类找出隐藏信息是地理信息系统的重要功能之一。与传统地图相比,地图上所载 负的数据是经过专门分类和处理过的,而地理信息系统存储的数据则具有原始数据的性质 所以可以根据不同的需要对数据再进行分类和提取。由于这种分类是对原始数据进行的再次 分类组织,因此称为再分类( Reclassification) 地理信息系统区别于其它信息系统的方面是其对空间信息的处理功能,同时也提供了对 非空间属性的处理功能,尽管比较简单,但它在实际应用中有着重要的作用。根据地理信息 的非空间属性,如材料、价值、使用性质等,进行再分类,这种纯粹基于非空间属性的分类, 与其它信息系统对简单结构化的数据进行分类的方法是一样的,可以使用经典的数理统计方 法,如主成分分析、层次分析、聚类分析、判别分析等等。这种分类属于普通的分类,它不 改变地物已有的属性值,而只是根据地物的属性,将它们划分到相应的类别中。本章主要论 述GIS中通过地物属性信息,经过分类组织产生新地物特征的再分类。 点线状地物的再分类,对于矢量数据结构可以通过简单的修改属性表中的数值来实现 对于栅格数据结构也可以通过修改属性值来获得新的点、线地物。面状地物的再分类,对于 栅格数据结构则和点、线分类一样,简单的改变属性数值并改变图例表现这一变化。例如有 个栅格图,属性值从1到15分别代表一种农作物,如果1到5及13为粮食作物,其它代 表经济作物,可将1到5和13重新赋值1,其它数赋值2,则可得到只有粮食作物和经济作 物两类地物的栅格图,并改变图例体现这一变化。对于矢量数据结构的面状地物再分类,则 需要同时改变实体的几何形状和属性。首要的任务是去掉将要合并的多边形之间的分界线 ( Line dissolve),再把这两个多边形的属性值变为同一属性。如图8-4所示: 图8-4:多边形的合并 因为对面状地物的再分类得到的新图层的类别比原图层少,称为归组( Group),它是 最常用和最简单的再分类。如果想把面状地物进一步分解成不同类别的地物,就不能用此方 法,因为不能知道界线的位置,可使用另一个图层,通过多边形叠加方法来实现。 上面讲的再分类方法,都是只根据面状地物本身的属性,通过重新改变属性值而实现分 类的目的,当然也可以结合邻域范围的属性值进行再分类。如坡度计算,缓冲区计算。再分 类还可以综合多个图层的属性信息,如图8-5所示 关于多边形叠加将在下面章节论述
邻域变换是指在计算新图层图元值时,不仅考虑原始图层上相应图元本身的值,而且还 要考虑与该图元有邻域关联的其它图元值的影响。这种关联可以是直接的几何关联,也可能 是间接的几何关联。常见的函数有平滑、离散点搜索、连续表面描述(坡度、坡向、可视域 分析)、点在多边形中的判断等。 区域变换是指在计算新图层属性值时,要考虑整个区域的属性值,即通过一个函数对某 一区域内的所有值进行综合,然后计算新属性值。常见的函数有求区域平均值、众数,极值、 求和、归组、整体插值等方法。 3.再分类 通过分类找出隐藏信息是地理信息系统的重要功能之一。与传统地图相比,地图上所载 负的数据是经过专门分类和处理过的,而地理信息系统存储的数据则具有原始数据的性质, 所以可以根据不同的需要对数据再进行分类和提取。由于这种分类是对原始数据进行的再次 分类组织,因此称为再分类(Reclassification)。 地理信息系统区别于其它信息系统的方面是其对空间信息的处理功能,同时也提供了对 非空间属性的处理功能,尽管比较简单,但它在实际应用中有着重要的作用。根据地理信息 的非空间属性,如材料、价值、使用性质等,进行再分类,这种纯粹基于非空间属性的分类, 与其它信息系统对简单结构化的数据进行分类的方法是一样的,可以使用经典的数理统计方 法,如主成分分析、层次分析、聚类分析、判别分析等等。这种分类属于普通的分类,它不 改变地物已有的属性值,而只是根据地物的属性,将它们划分到相应的类别中。本章主要论 述 GIS 中通过地物属性信息,经过分类组织产生新地物特征的再分类。 点、线状地物的再分类,对于矢量数据结构可以通过简单的修改属性表中的数值来实现, 对于栅格数据结构也可以通过修改属性值来获得新的点、线地物。面状地物的再分类,对于 栅格数据结构则和点、线分类一样,简单的改变属性数值并改变图例表现这一变化。例如有 一个栅格图,属性值从 1 到 15 分别代表一种农作物,如果 1 到 5 及 13 为粮食作物,其它代 表经济作物,可将 1 到 5 和 13 重新赋值 1,其它数赋值 2,则可得到只有粮食作物和经济作 物两类地物的栅格图,并改变图例体现这一变化。对于矢量数据结构的面状地物再分类,则 需要同时改变实体的几何形状和属性。首要的任务是去掉将要合并的多边形之间的分界线 (Line Dissolve),再把这两个多边形的属性值变为同一属性。如图 8-4 所示: 图 8-4:多边形的合并 因为对面状地物的再分类得到的新图层的类别比原图层少,称为归组(Group),它是 最常用和最简单的再分类。如果想把面状地物进一步分解成不同类别的地物,就不能用此方 法,因为不能知道界线的位置,可使用另一个图层,通过多边形叠加方法来实现*。 上面讲的再分类方法,都是只根据面状地物本身的属性,通过重新改变属性值而实现分 类的目的,当然也可以结合邻域范围的属性值进行再分类。如坡度计算,缓冲区计算。再分 类还可以综合多个图层的属性信息,如图 8-5 所示。 * 关于多边形叠加将在下面章节论述
Values Values values 3 14 图8-5:多个属性的再分类 4.缓冲区分析 邻近度( Proximity)描述了地理空间中两个地物距离相近的程度,其确定是空间分析的 一个重要手段。交通沿线或河流沿线的地物有其独特的重要性,公共设施(商场,邮局,银 行,医院,车站,学校等)的服务半径,大型水库建设引起的搬迁,铁路,公路以及航运河 道对其所穿过区域经济发展的重要性等,均是一个邻近度问题。缓冲区分析是解决邻近度问 题的空间分析工具 之 所谓缓冲区就是地理空间目标的一种影响范围或服务范围。从数学的角度看,缓冲区分 析的基本思想是给定一个空间对象或集合,确定它们的邻域,邻域的大小由邻域半径R决 定。因此对象O的缓冲区定义为 B={x:d(x,O)≤R} 即对象O1的半径为R的缓冲区为距O的距离d小于R的全部点的集合。d一般是最小欧 氏距离,但也可是其它定义的距离。对于对象集合 O=0 其半径为R的缓冲区是各个对象缓冲区的并,即: B 图8-6为点对象、线对象、面对象及对象集合的缓冲区示例
图 8-5:多个属性的再分类 4.缓冲区分析 邻近度(Proximity)描述了地理空间中两个地物距离相近的程度,其确定是空间分析的 一个重要手段。交通沿线或河流沿线的地物有其独特的重要性,公共设施(商场,邮局,银 行,医院,车站,学校等)的服务半径,大型水库建设引起的搬迁,铁路,公路以及航运河 道对其所穿过区域经济发展的重要性等,均是一个邻近度问题。缓冲区分析是解决邻近度问 题的空间分析工具之一 。 所谓缓冲区就是地理空间目标的一种影响范围或服务范围。从数学的角度看,缓冲区分 析的基本思想是给定一个空间对象或集合,确定它们的邻域,邻域的大小由邻域半径 R 决 定。因此对象 Oi 的缓冲区定义为: Bi = x : d(x,Oi ) R 即对象 Oi 的半径为 R 的缓冲区为距 Oi 的距离 d 小于 R 的全部点的集合。d 一般是最小欧 氏距离,但也可是其它定义的距离。对于对象集合 O = Oi : i =1,2, ,n 其半径为 R 的缓冲区是各个对象缓冲区的并,即: n i B Bi =1 = 图 8-6 为点对象、线对象、面对象及对象集合的缓冲区示例
图8-6:点、线、多边形的缓冲区 另外还有一些特殊形态的缓冲区,如点对象有三角形,矩形和圈形等,对于线对象有双 侧对称,双侧不对称或单侧缓冲区,对于面对象有内侧和外侧缓冲区。这些适合不同应用要 求的缓冲区,尽管形态特殊,但基本原理是一致的。 缓冲区计算的基本问题是双线问题。双线问题有很多另外的名称,如图形加粗,加宽线, 中心线扩张等,它们指的都是相同的操作。 1)角分线法 双线问题最简单的方法是角分线法(简单平行线法)。算法是在轴线首尾点处,作轴线 的垂线并按缓冲区半径R截出左右边线的起止点;在轴线的其它转折点上,用与该线所关 联的前后两邻边距轴线的距离为R的两平行线的交点来生成缓冲区对应顶点。如图8-7所示。 图8-7:角平分线法 角分线法的缺点是难以最大限度保证双线的等宽性,尤其是在凸侧角点在进一步变锐 时,将远离轴线顶点。根据上图,远离情况可由下式表示 d=R/sin(B/2) 当缓冲区半径不变时,d随张角B的减小而增大,结果在尖角处双线之间的宽度遭到破坏 因此,为克服角分线法的缺点,要有相应的补充判别方案,用于校正所出现的异常情况 但由于异常情况不胜枚举,导致校正措施繁杂。 2)凸角圆弧法 在轴线首尾点处,作轴线的垂线并按双线和缓冲区半径截出左右边线起止点:在轴线其
图 8-6:点、线、多边形的缓冲区 另外还有一些特殊形态的缓冲区,如点对象有三角形,矩形和圈形等,对于线对象有双 侧对称,双侧不对称或单侧缓冲区,对于面对象有内侧和外侧缓冲区。这些适合不同应用要 求的缓冲区,尽管形态特殊,但基本原理是一致的。 缓冲区计算的基本问题是双线问题。双线问题有很多另外的名称,如图形加粗,加宽线, 中心线扩张等,它们指的都是相同的操作。 1)角分线法 双线问题最简单的方法是角分线法(简单平行线法)。算法是在轴线首尾点处,作轴线 的垂线并按缓冲区半径 R 截出左右边线的起止点;在轴线的其它转折点上,用与该线所关 联的前后两邻边距轴线的距离为R的两平行线的交点来生成缓冲区对应顶点。如图8-7所示。 图 8-7:角平分线法 角分线法的缺点是难以最大限度保证双线的等宽性,尤其是在凸侧角点在进一步变锐 时,将远离轴线顶点。根据上图,远离情况可由下式表示: d = R sin(B 2) 当缓冲区半径不变时,d 随张角 B 的减小而增大,结果在尖角处双线之间的宽度遭到破坏。 因此,为克服角分线法的缺点,要有相应的补充判别方案,用于校正所出现的异常情况。 但由于异常情况不胜枚举,导致校正措施繁杂。 2)凸角圆弧法 在轴线首尾点处,作轴线的垂线并按双线和缓冲区半径截出左右边线起止点;在轴线其
它转折点处,首先判断该点的凸凹性,在凸侧用圆弧弥合,在凹侧则用前后两邻边平行线的 交点生成对应顶点。这样外角以圆弧连接,内角直接连接,线段端点以半圆封闭。如图8-8 所示 图8-8:凸角圆弧法 在凹侧平行边线相交在角分线上。交点距对应顶点的距离与角分线法类似公式: d=R/sin(B/2) 该方法最大限度的保证了平行曲线的等宽性,避免了角分线法的众多异常情况 该算法非常重要的一环是折点凸凹性的自动判断。此问题可转化为两个矢量的叉积:把 相邻两个线段看成两个矢量,其方向取坐标点序方向。若前一个矢量以最小角度扫向第二个 矢量时呈逆时针方向,则为凸顶点,反之为凹顶点。具体算法过程如下 由矢量代数可知,矢量A,BC可用其端点坐标差表示(99) 图89:采用向量叉乘判断向量排列 AB=XB-XYB-Y=la,a BC=(xc-XB,Yc-Y8)=(b, b,) S=ABxBC=axb=(a, b , -b, a,) XXYc-Y)-(Xc-XBXYB-Y) 矢量代数叉积遵循右手法则,即当ABC呈逆时针方向时,S为正,否则为负 若S>0,则ABC呈逆时针,顶点为凸 若S<0,则ABC呈顺时针,顶点为凹 若S=0,则ABC三点共线 对于简单情形,缓冲区是一个简单多边形,但当计算形状比较复杂的对象或多个对象集 合的缓冲区时,就复杂得多。为使缓冲区算法适应更为普遍的情况,就不得不处理边线自相
它转折点处,首先判断该点的凸凹性,在凸侧用圆弧弥合,在凹侧则用前后两邻边平行线的 交点生成对应顶点。这样外角以圆弧连接,内角直接连接,线段端点以半圆封闭。如图 8-8 所示。 图 8-8:凸角圆弧法 在凹侧平行边线相交在角分线上。交点距对应顶点的距离与角分线法类似公式: d = R sin(B 2) 该方法最大限度的保证了平行曲线的等宽性,避免了角分线法的众多异常情况。 该算法非常重要的一环是折点凸凹性的自动判断。此问题可转化为两个矢量的叉积:把 相邻两个线段看成两个矢量,其方向取坐标点序方向。若前一个矢量以最小角度扫向第二个 矢量时呈逆时针方向,则为凸顶点,反之为凹顶点。具体算法过程如下: 由矢量代数可知,矢量 AB,BC 可用其端点坐标差表示(9-9): S A B C a b 图 8-9:采用向量叉乘判断向量排列 ( ) ( ) B A B A x y AB = X − X ,Y −Y = a ,a ( ) ( ) C B C B x y BC = X − X ,Y −Y = b ,b ( ) ( )( ) ( )( ) B A C B C B B A x y x y X X Y Y X X Y Y S AB BC a b a b b a = − − − − − = = = − 矢量代数叉积遵循右手法则,即当 ABC 呈逆时针方向时,S 为正,否则为负。 若 S>0,则 ABC 呈逆时针,顶点为凸; 若 S<0,则 ABC 呈顺时针,顶点为凹; 若 S=0,则 ABC 三点共线。 对于简单情形,缓冲区是一个简单多边形,但当计算形状比较复杂的对象或多个对象集 合的缓冲区时,就复杂得多。为使缓冲区算法适应更为普遍的情况,就不得不处理边线自相