目录 第六章时间序列分析及应用 153 第一节时间序列概述……… 153 、时间序列的意义 153 二、时间序列的种类 154 三、时间序列编制原则 154 四、时间序列的建立 ∴155 第二节时间序列分析 157 、时间序列分析概念 157 、确定性与随机性时间序列分析. 158 时间序列分析方法 158 四、时间序列的应用 159 第三节时间序列及其特征识别 160 、时间序列与随机过程 160 、时间序列的识别判据 162 三、时间序列特征的识别 164 第四节平稳时间序列模型… 167 一阶自回归模型… 167 、一般自回归模型. 移动平均模型 169 四、自回归移动平均模型 169 152
152 目录 第六章 时间序列分析及应用 ............................................................................................153 第一节 时间序列概述....................................................................................................153 一、时间序列的意义 ....................................................................................................153 二、时间序列的种类 ....................................................................................................154 三、时间序列编制原则 ................................................................................................154 四、时间序列的建立 ....................................................................................................155 第二节 时间序列分析....................................................................................................157 一、时间序列分析概念 ................................................................................................157 二、确定性与随机性时间序列分析.............................................................................158 三、时间序列分析方法 ................................................................................................158 四、时间序列的应用 ....................................................................................................159 第三节 时间序列及其特征识别 ....................................................................................160 一、时间序列与随机过程 ............................................................................................160 二、时间序列的识别判据 ............................................................................................162 三、时间序列特征的识别 ............................................................................................164 第四节 平稳时间序列模型 ............................................................................................167 一、一阶自回归模型 ....................................................................................................167 二、一般自回归模型 ....................................................................................................168 三、移动平均模型........................................................................................................169 四、自回归移动平均模型 ............................................................................................169
第六章时间序列分析及应用 第一节时间序列概述 、时间序列的意义 (1)时间序列的概念 也称时间数列、动态数列,是指将某一统计指标在不同时间上的数值,按时间先后顺序 加以排列后形成的统计数列。例如,某省1995-2001年的生产总值、年末总人口、人均生产 总值、职工年平均工资资料。见表6.1。 表611995-2001年某省有关指标 年份某省生产总值(亿元)年末总人口(万人)人均生产总值(元/人)职工年平均工资(元) 2849.52 6437 4444 4839 1996 3452.97 6484 5345 5286 1997 3953.78 6525 6079 5692 4256.01 50l 5820 1999 6614 6932 6421 2000 5088.96 6674 7663 7043 2001 5577.78 6699 8362 7864 我们可以从三个方面理解时间序列: 从统计意义上讲,时间序列指时间序列数据“ Time Series data”,即将某一个指标在不同 时间上的统计数值,按时间的先后顺序排列而成的数列。比如,1980~2016年中国的GDP。 常用的宏观时间序列有三种频率,月度( monthly)、季度( quarterly)、年度( annual)。 其它数据有截面、日度、周、时、不规则数据等。 从数学意义上讲,时间序列是随机过程( stochastic process)一个特例,即由有序的随机 变量( random variable)组成的序列,设T为一个有序集,以T中元素t为下标的变量Xt是随 机变量,则{Xt|t∈T}是一个时间序列,因为T为有序集,于是时间序列也可以表示为 {X,X1,X1,…} (6.1) 或简单表示为 (62) 通常我们用 XYZ 来表示时间序列。 153
153 第六章 时间序列分析及应用 第一节 时间序列概述 一、时间序列的意义 (1)时间序列的概念 也称时间数列、动态数列,是指将某一统计指标在不同时间上的数值,按时间先后顺序 加以排列后形成的统计数列。例如,某省 1995-2001 年的生产总值、年末总人口、人均生产 总值、职工年平均工资资料。见表 6.1。 表 6.1 1995-2001 年某省有关指标 年份 某省生产总值(亿元) 年末总人口(万人) 人均生产总值(元/人) 职工年平均工资(元) 1995 2849.52 6437 4444 4839 1996 3452.97 6484 5345 5286 1997 3953.78 6525 6079 5692 1998 4256.01 6569 6501 5820 1999 4569.19 6614 6932 6421 2000 5088.96 6674 7663 7043 2001 5577.78 6699 8362 7864 我们可以从三个方面理解时间序列: 从统计意义上讲,时间序列指时间序列数据“Time Series Data” ,即将某一个指标在不同 时间上的统计数值,按时间的先后顺序排列而成的数列。比如,1980~2016 年中国的 GDP。 常用的宏观时间序列有三种频率,月度(monthly)、季度(quarterly)、年度(annual)。 其它数据有截面、日度、周、时、不规则数据等。 从数学意义上讲,时间序列是随机过程(stochastic process)一个特例,即由有序的随机 变量(random variable)组成的序列,设 T 为一个有序集,以 T 中元素 t 为下标的变量 Xt 是随 机变量,则 {Xt | t∈T} 是一个时间序列,因为 T 为有序集,于是时间序列也可以表示为 {X ,X ,X , } 1 2 3 t t t (6.1) 或简单表示为 {X ,X ,X , } 1 2 3 (6.2) 通常我们用 t t Zt X , Y , (6.3) 来表示时间序列
时间序列中的时间指广义时间,即有序集,不一定非得是狭义的时间概念,只要是有顺 序的随机变量列就是时间序列,比如,温度、湿度、速度、压力等有“顺序”意义的物理量 从系统意义上讲,时间序列就是某一系统在不同时间(广义时间)上的响应,即系统在 不同时刻的状态值,比如正在飞行着的宇宙飞船系统每隔10分钟所记录的飞行速度等。 (2)时间序列的构成要素 现象所属的时间;是反映客观现象的指标数值。 (3)时间序列的作用 反映现象在不同时间上的规模和水平;反映社会经济现象发展变化的过程和趋势:探 索某些社会经济现象发展变化的规律性;建立数学模型,预测未来 二、时间序列的种类 l、绝对数时间序列 把总量指标在不同时间上的数值按时间先后顺序加以排列就形成了绝对数时间序列 (1)时期数列 所列总量指标都是反映社会经济现象在一段时间内发展过程的总量的时间序列。如:表 5-1中某省各年国内生产总值就是时期数列。其特点: 可相加性:时期数列中各指标数值可以相加。 直接相关性:时期数列中各指标数值的大小与所包含时期的长短有直接关系。 连续性:时期数列中各个指标数值是由连续不断的登记取得的 (2)时点数列 所列总量指标都是反映社会经济现象在某一时刻(或瞬间)上的总量的动态数列。如 表5-1中某省各年年末人口数就是该数列。 特点: 不可相加性:数列中各项指标数值不具有可加性: 无直接相关性:数列中各指标值的大小与其时间间隔无直接关系; 次性:数列中的各指标值一般是通过一次性登记取得的 2、相对数时间序列 把相对指标在不同时间上的数值按时间先后顺序加以排列就形成了相对数时间序列 如:表5-1中年人均生产总值就是相对数时间序列 特点:各个指标数值是不能相加的。 3、平均数时间序列 把平均指标在不同时间上的数值按时间先后顺序加以排列就形成了平均数时间序列。如 表5-1中,各年职工年平均工资就是平均数时间序列 特点数列中各个指标数值也是不能相加的。 三、时间序列编制原则 指标的可比性是编制时间序列要遵守的基本原则,具体说,可比性的具体表现如下: 1)时期长短应该相等 在时期数列中各个指标值的大小与时期长短有直接关系。一般时期越长,数值越大,反之 154
154 时间序列中的时间指广义时间,即有序集,不一定非得是狭义的时间概念,只要是有顺 序的随机变量列就是时间序列,比如,温度、湿度、速度、压力等有“顺序”意义的物理量。 从系统意义上讲,时间序列就是某一系统在不同时间(广义时间)上的响应,即系统在 不同时刻的状态值,比如正在飞行着的宇宙飞船系统每隔 10 分钟所记录的飞行速度等。 (2)时间序列的构成要素 现象所属的时间;是反映客观现象的指标数值。 (3)时间序列的作用 反映现象在不同时间上的规模和水平;反映社会经济现象发展变化的过程和趋势; 探 索某些社会经济现象发展变化的规律性;建立数学模型,预测未来。 二、时间序列的种类 1、绝对数时间序列 把总量指标在不同时间上的数值按时间先后顺序加以排列就形成了绝对数时间序列。 (1)时期数列 所列总量指标都是反映社会经济现象在一段时间内发展过程的总量的时间序列。如:表 5-1 中某省各年国内生产总值就是时期数列。其特点: 可相加性:时期数列中各指标数值可以相加。 直接相关性:时期数列中各指标数值的大小与所包含时期的长短有直接关系。 连续性:时期数列中各个指标数值是由连续不断的登记取得的。 (2)时点数列 所列总量指标都是反映社会经济现象在某一时刻(或瞬间)上的总量的动态数列。如: 表 5-1 中某省各年年末人口数就是该数列。 特点: 不可相加性:数列中各项指标数值不具有可加性; 无直接相关性:数列中各指标值的大小与其时间间隔无直接关系; 一次性:数列中的各指标值一般是通过一次性登记取得的。 2、相对数时间序列 把相对指标在不同时间上的数值按时间先后顺序加以排列就形成了相对数时间序列。 如:表 5-1 中年人均生产总值就是相对数时间序列。 特点: 各个指标数值是不能相加的。 3、平均数时间序列 把平均指标在不同时间上的数值按时间先后顺序加以排列就形成了平均数时间序列。如 表 5-1 中,各年职工年平均工资就是平均数时间序列。 特点: 数列中各个指标数值也是不能相加的。 三、时间序列编制原则 指标的可比性是编制时间序列要遵守的基本原则,具体说,可比性的具体表现如下: 1)时期长短应该相等。 在时期数列中各个指标值的大小与时期长短有直接关系。一般时期越长,数值越大,反之
就小,所以时期数列各指标所属时期的长短应该相等。 在特殊研究目的下,也可编制时期不等的时期数列 如:我国几个重要时期的钢产量资料(表62) 表6.2我国几个重要时期的钢产量(万吨) 时期190019491953-19571981-19851986-1901991-19951996-2000 钢产量 1667 20304 27372 42478 73407 时点数列间隔期是否相等可根据实际情况和需要而定。但为了便于比较分析,各指标数 值之间的间隔也最好相等。 2)指标的经济内容必须相同 例如:农业总产值指标在1993年前后对于副业的处理就不同,使用时应注意调整 3)指标值所属的总体范围应该一致 例如:要研究某一地区的经济发展情况,要注意该地区行政区划是否发生过变更。 4)指标的计算方法和计量单位必须统 例如:劳动生产率指标中的产量用实物量还是价值量,人数用从业人员数还是工人(含 学徒工)人数,前后要统 再如,产值指标的不变价格和现行价格问题 四、时间序列的建立 时间序列分析的主要处理对象是来自所研究系统的时间序列的数据样本资料。因此,获 取时间序列数据是时间序列分析的基础工作。时间序列数据在使用之前要进行认真的检查 我们把获取时间序列数据以及对其进行检查、整理和预处理工作,称为时间序列的建立, (1)时间序列数据的采集 对于时间序列所对应的系统来说,由于时间的连续性,时间序列系统也是连续的,但为 了数字计算处理的方便,往往只能按照一定的时间间隔对所研究的系统进行观察记录,称之 为采样。将观察记录的时间间隔称为采样间隔,用△表示。若采样间隔为一年,则△=1年 如年度GDP,若采样间隔为一月,则Δ=1月。同理,Δ可以是日、时、分等,每个观察值 也称为采样值,第k个采样值记为Xk 采样间隔可以相等,可以不等,我们所用的方法是间隔相等的情况。当确定了采样间隔 △之后,采得样本数据,这时我们便丢失了时间序列X1在X1与X1+(1=1,2,n-1)之间的 信息。然而,采样间隔Δ越小,信息损失虽也少,但数据收集、处理工作量加大,成本较大 反之,采样间隔Δ越大,收集处理工作量减少,但信息损失较大。因此,选择合适的采样间 隔是建立时间序列的关键。 (2)离群点的检验与处理 离群点( outlier)是指一个时间序列中,远离序列一般水平的极端大和极端小值。因此, 也称之为奇异值,有时也称其为野值。如描述1949年到1997年间我国的人口自然增长率 (X1)。1960年的人口自然增长率大大低于其它年份的值。从序列来看,X12(即1960年 的观察值)远离序列的一般趋势,称X12为离群点。 般来说,这种结果是由于系统受外部干扰而造成的,但形成离群点的系统外部干扰是 155
155 就小,所以时期数列各指标所属时期的长短应该相等。 在特殊研究目的下,也可编制时期不等的时期数列。 如:我国几个重要时期的钢产量资料(表 6.2) 表 6.2 我国几个重要时期的钢产量(万吨) 时 期 1900-1949 1953-1957 1981-1985 1986-1990 1991-1995 1996-2000 钢产量 776 1667 20304 27372 42478 73407 时点数列间隔期是否相等可根据实际情况和需要而定。但为了便于比较分析,各指标数 值之间的间隔也最好相等。 2)指标的经济内容必须相同 例如:农业总产值指标在 1993 年前后对于副业的处理就不同,使用时应注意调整。 3)指标值所属的总体范围应该一致 例如:要研究某一地区的经济发展情况,要注意该地区行政区划是否发生过变更。 4)指标的计算方法和计量单位必须统一。 例如:劳动生产率指标中的产量用实物量还是价值量,人数用从业人员数还是工人(含 学徒工)人数,前后要统一。 再如,产值指标的不变价格和现行价格问题。 四、时间序列的建立 时间序列分析的主要处理对象是来自所研究系统的时间序列的数据样本资料。因此,获 取时间序列数据是时间序列分析的基础工作。时间序列数据在使用之前要进行认真的检查, 我们把获取时间序列数据以及对其进行检查、整理和预处理工作,称为时间序列的建立。 (1)时间序列数据的采集 对于时间序列所对应的系统来说,由于时间的连续性,时间序列系统也是连续的,但为 了数字计算处理的方便,往往只能按照一定的时间间隔对所研究的系统进行观察记录,称之 为采样。将观察记录的时间间隔称为采样间隔,用△ 表示。若采样间隔为一年,则△=1 年, 如年度 GDP,若采样间隔为一月,则△=1 月。同理, △可以是日、时、分等,每个观察值 也称为采样值,第 k 个采样值记为 Xk。 采样间隔可以相等,可以不等,我们所用的方法是间隔相等的情况。当确定了采样间隔 △之后,采得样本数据,这时我们便丢失了时间序列 Xt 在 Xi 与 Xi+1(i=1,2,…,n-1)之间的 信息。然而,采样间隔△越小,信息损失虽也少,但数据收集、处理工作量加大,成本较大。 反之,采样间隔△越大,收集处理工作量减少,但信息损失较大。因此,选择合适的采样间 隔是建立时间序列的关键。 (2)离群点的检验与处理 离群点(outlier)是指一个时间序列中,远离序列一般水平的极端大和极端小值。因此, 也称之为奇异值,有时也称其为野值。如描述 1949 年到 1997 年间 我国的人口自然增长率 ( Xt )。1960 年的人口自然增长率大大低于其它年份的值。从序列来看, X12(即 1960 年 的观察值)远离序列的一般趋势,称 X12 为离群点。 一般来说,这种结果是由于系统受外部干扰而造成的,但形成离群点的系统外部干扰是
多种多样的。第一种可能性是采样误差,如记录仪偏误、工作人员岀现笔误、计算错误等都 可能产生极大或极小值。第二种是所研究的系统受到偶然、非正常因素而产生的,如上述人 口自然增长率时间序列中。由于受到象地震、水灾、旱灾等自然现象有影响某些经济指标出 现异常值。 不论是何种因素形成的离群点,对时间序列分析都会带来一定的影响,因而,对离群点 要进行与处理。 在时间序列分析中,通常把离群点分为四种 第一种是加性离群点( Additive outlier)。引起离群点的干扰,只影响该干扰发生的哪- 时刻T上的序列值XT,不会影响其后的值Xr+1,XT+2,(如记录或录入错误)。 第二种为更新离群点( Innovational outlier),产生离群点的干扰不仅作用于Xr,而且影 响T时刻以后序列的所有值,Xr+1,XT+2,,这一时刻意味着一个外部干扰作用于系统的开 始(如降息对于储蓄的影响)。 第三种是水平位移离群点( Level shift outlier),此时系统出现向上或冋下跳跃,引起此 类干扰的原因是系统在时刻T发生了结构性变化,并持续影响T时刻之后的所有行为(如农 村体制改革)。在数据上往往表现出T时刻前后发生水生水平位移 第四种是暂时变更离群点( Temporary change outlier),引进这一现象的干扰在T时刻发 生时具有一定的初始效应,以后随着时间根据衰减因子的大小呈现指数衰减趋势。(如消费受 价格的干扰)。 在取得时间序列之后,通过序列的直观变化图(Line)即可初步看出是否有离群点,如 果有,再作进一步的检查。 离群点的检验方法: 比较简单的一种检验方法是将序列值与平滑值进行比较,检验是否存在明显大或小的序 列值。这种方法是假定正常的序列是较为平滑的,而离群点使序列产生非平滑现象。具体方 法如下: 令2表示先对X1作平滑再取平方所得值:令H2表示先对x1取平方再作平滑所得值 若 X-k s Ytk 则认为X+1是正常点,否则,是离群点。k为分析时设定的数学,一般为3~9,不 妨取k=6。 若x1为离群点,用,来修正之,即用 (66) 来代替序列中Xt+1的值 (3)缺损值的补充
156 多种多样的。第一种可能性是采样误差,如记录仪偏误、工作人员出现笔误、计算错误等都 可能产生极大或极小值。第二种是所研究的系统受到偶然、非正常因素而产生的,如上述人 口自然增长率时间序列中。由于受到象地震、水灾、旱灾等自然现象有影响某些经济指标出 现异常值。 不论是何种因素形成的离群点,对时间序列分析都会带来一定的影响,因而,对离群点 要进行与处理。 在时间序列分析中,通常把离群点分为四种: 第一种是加性离群点(Additive outlier)。引起离群点的干扰,只影响该干扰发生的哪一 时刻 T 上的序列值 XT,不会影响其后的值 XT+1, XT+2 ,…(如记录或录入错误)。 第二种为更新离群点(Innovational outlier),产生离群点的干扰不仅作用于 XT ,而且影 响 T 时刻以后序列的所有值, XT+1, XT+2 ,…,这一时刻意味着一个外部干扰作用于系统的开 始(如降息对于储蓄的影响)。 第三种是水平位移离群点(Level shift outlier),此时系统出现向上或向下跳跃,引起此 类干扰的原因是系统在时刻 T 发生了结构性变化,并持续影响 T 时刻之后的所有行为(如农 村体制改革)。在数据上往往表现出 T 时刻前后发生水生水平位移。 第四种是暂时变更离群点(Temporary change outlier),引进这一现象的干扰在 T 时刻发 生时具有一定的初始效应,以后随着时间根据衰减因子的大小呈现指数衰减趋势。(如消费受 价格的干扰)。 在取得时间序列之后,通过序列的直观变化图(Line)即可初步看出是否有离群点,如 果有,再作进一步的检查。 离群点的检验方法: 比较简单的一种检验方法是将序列值与平滑值进行比较,检验是否存在明显大或小的序 列值。这种方法是假定正常的序列是较为平滑的,而离群点使序列产生非平滑现象。具体方 法如下: 令 2 t X 表示先对 Xt 作平滑再取平方所得值;令 2 t X 表示先对 Xt 取平方再作平滑所得值。 令 2 2 2 t t t S X X = − (6.4) 若 1 t t t t t X k S X X k S + − + (6.5) 则认为 Xt+1 是正常点,否则,是离群点。k 为分析时设定的数学,一般为 3~9,不 妨取 k=6。 若 Xt+1 为离群点,用 1 ˆ t X + 来修正之,即用 1 1 ˆ 2 t t t X X X + − = − (6.6) 来代替序列中 Xt+1 的值。 (3)缺损值的补充
在采集时间序列样本时,有时由于仪器故障、操作失误、或其它原因使某些样本观察值 未能记录下来,这种缺少的观察值称为缺损值( Missing value)。 由于时间序列分析的需要,对这样的缺损值要给予补充 具体方法有估算、推测等。如增长量推算法、发展速度推算法、比例推算法、平滑法 插值法等等。 此外,在对一序列进行分析之前,还要对序列中的每一个数据的指标口径、计算范围、 计算方法、计量单位等进行认真检査,在研究经济方面的价值量序列时,还必须检査是否按 照可比价格算得,否则,要进行价格调整。 以中国的年度国内生产总值GDP( Gross domestic Product)时间序列的建立为例,简要 说明建立时间序列的一般过程。GDP是以国土原则统计的,凡是我国领土范围之内所产生的 增加值,均计入我国的GDP,一般我们分析所用的GDP均为统计部门提供的现有数据,要 注意的是,在我国,大多数情况所拿到的数据是现行价格水平,在进行时间序列分析之前, 要进行价格处理,即换算成可比价水平,这样时间序列数据才有意义,否则,不同年份的数 据不可比。换算的方法较为简单,要取得同区间上的价格指数时间序列数据,用现价的GDP 序列除以价格指数,然后再乘以100即得GDP的可比价数据。(相当于用GDP除以基期为1 的价格指数)。 类似地,凡是价值量指标,比如收入水平、消费水平、增加值、利润额、销售额、税收 额、资产额等等,此类指标的时间序列数据在分析之前一定要作价格平减(或缩减),即用现 价数据除以基期为1的相应价格指数,价值量的现价时序数据直接分析而得的结果无意义 比如设1981年某人的年收入水平是800元(现价,或名义收入),2000年他的年收入水 平是24000元(同上),从现价水平来看,2000年收入水平是1980年的30倍,是否能说明 他的收入水平在20年间上升了29倍呢?当然不能,事实上,以1981年的价格指数为1,2000 年的价格指数是32。用800除以1,仍是800,但是用24000除以3.2得7500(可比价收入 或实际收入),这说明扣除价格因素,2000年他的收入水平是1981年9.375倍。(与30倍相 差很多!看来,考虑价格变动与不考虑价格变动的差异是惊人的。) 第二节时间序列分析 、时间序列分析概念 在社会、经济及自然现象中,时间序列数据随处可见,随着社会的进步,人民生活水平 的提高,一方面,人的寿命在提高,生命周期在延长,另一方面,随着环境及精神污染的加 速,世界上患病者人数在增加,吸毒人数也在增加,等等。这些数据依据时间的先后顺序排 列,都是时间序列数据 时间序列分析可用于许多学科。比如,天文学中的太阳黑子数、地球物理学中的地震波 序列、海洋学中的浪高序列、气象学中的降雨量序列、医学上的脑电波序列、雷达系统对 标的定位序列等,都是时间序列。 每一时间序列都包含了产生该序列的系统的历史行为的全部信息。问题是如何才能根据 这些时间序列的变化,较精确地找出相应系统的内在统计特征和发展规律性,尽可能地从中 提取出我们所需要的准确信息。用来实现上述目的的方法总称为时间序列分析。它是一种根 157
157 在采集时间序列样本时,有时由于仪器故障、操作失误、或其它原因使某些样本观察值 未能记录下来,这种缺少的观察值称为缺损值(Missing Value)。 由于时间序列分析的需要,对这样的缺损值要给予补充。 具体方法有估算、推测等。如增长量推算法、发展速度推算法、比例推算法、平滑法、 插值法等等。 此外,在对一序列进行分析之前,还要对序列中的每一个数据的指标口径、计算范围、 计算方法、计量单位等进行认真检查,在研究经济方面的价值量序列时,还必须检查是否按 照可比价格算得,否则,要进行价格调整。 以中国的年度国内生产总值 GDP(Gross Domestic Product)时间序列的建立为例,简要 说明建立时间序列的一般过程。GDP 是以国土原则统计的,凡是我国领土范围之内所产生的 增加值,均计入我国的 GDP,一般我们分析所用的 GDP 均为统计部门提供的现有数据,要 注意的是,在我国,大多数情况所拿到的数据是现行价格水平,在进行时间序列分析之前, 要进行价格处理,即换算成可比价水平,这样时间序列数据才有意义,否则,不同年份的数 据不可比。换算的方法较为简单,要取得同区间上的价格指数时间序列数据,用现价的 GDP 序列除以价格指数,然后再乘以 100 即得 GDP 的可比价数据。(相当于用 GDP 除以基期为 1 的价格指数)。 类似地,凡是价值量指标,比如收入水平、消费水平、增加值、利润额、销售额、税收 额、资产额等等,此类指标的时间序列数据在分析之前一定要作价格平减(或缩减),即用现 价数据除以基期为 1 的相应价格指数,价值量的现价时序数据直接分析而得的结果无意义。 比如设 1981 年某人的年收入水平是 800 元(现价,或名义收入),2000 年他的年收入水 平是 24000 元(同上),从现价水平来看,2000 年收入水平是 1980 年的 30 倍,是否能说明 他的收入水平在 20 年间上升了 29 倍呢?当然不能,事实上,以 1981 年的价格指数为 1,2000 年的价格指数是 3.2。用 800 除以 1,仍是 800,但是用 24000 除以 3.2 得 7500(可比价收入 或实际收入),这说明扣除价格因素,2000 年他的收入水平是 1981 年 9.375 倍。(与 30 倍相 差很多!看来,考虑价格变动与不考虑价格变动的差异是惊人的。) 第二节 时间序列分析 一、时间序列分析概念 在社会、经济及自然现象中,时间序列数据随处可见,随着社会的进步,人民生活水平 的提高,一方面,人的寿命在提高,生命周期在延长,另一方面,随着环境及精神污染的加 速,世界上患病者人数在增加,吸毒人数也在增加,等等。这些数据依据时间的先后顺序排 列,都是时间序列数据。 时间序列分析可用于许多学科。比如,天文学中的太阳黑子数、地球物理学中的地震波 序列、海洋学中的浪高序列、气象学中的降雨量序列、医学上的脑电波序列、雷达系统对目 标的定位序列等,都是时间序列。 每一时间序列都包含了产生该序列的系统的历史行为的全部信息。问题是如何才能根据 这些时间序列的变化,较精确地找出相应系统的内在统计特征和发展规律性,尽可能地从中 提取出我们所需要的准确信息。用来实现上述目的的方法总称为时间序列分析。它是一种根
据动态数据揭示系统动态结构和规律性的统计方法,是统计学的一个分支。其基本思想是根 据系统的有限长度的运行记录(样本数据),建立能够比较精确地反映时间序列中所包含的动 态依存关系的数学模型,并借以对系统的未来发展进行预报(时间序列预测)。 时间序列分析”是概率统计学的一个分支,近二十多年来,无论在理论还是应用方面 都有迅速的发展,它所提供的动态数据处理方法在国际国内的应用正日渐广泛,而且随着计 算机的普及,生命力越来越旺盛 最早的时间序列分析可以追溯到7000年前的古埃及。古埃及人把尼罗河涨落的情况逐天 记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非 常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿 烂的史前文明。 、确定性与随机性时间序列分析 时间序列依据其特征,有以下几种表现形式,并产生与之相适应的分析方法 1)长期趋势变化 受某种基本因素的影响,数据依时间变化时表现为一种确定倾向,它按某种规则稳步地 增长或下降。 使用的分析方法有:移动平均法、指数平滑法、模型拟和法等。 2)季节性周期变化 受季节更替等因素影响,序列依一固定周期规则性的变化,又称商业循环。 采用的方法:季节指数。 3)循环变化 周期不固定的波动变化 4)随机性变化 由许多不确定因素引起的序列变化 三、时间序列分析方法 时间序列分析方法按照采用的手段不同可分为数据图法、指标法和模型法三类 (1)数据图法 即将时间序列数据采用一定的软件绘制变化图(Line、Bar),从而可以直观地了解其变 化的总趋势、变化周期以及异常点、转折点等信息。这一方法常常作为其他方法的切入点 (2)指标法 指标法是通过计算反映系统变化的一系列核心指标值从而了解系统的内在变化规律。如 反映变化率的发展速度与增长速度。 (3)模型法 模型法是针对不同的时间序列,根据统计与数学方法,建立描述该序列的数学模型,以 此来作预测。最常见的有ARMA模型等。 时间序列的基本特征就是研究序列随时间发展的规律。其区别于其他统计分析的重要特 征之一,就是重视顺序的重要性。其次,时间序列分析区别于其他统计分析方法的特征也在 于其所分析的主要依据仅在于时间序列信息本身,它依据其历史变化信息(样本数据)预测 未来的可能状态,不同于其他的方法,如回归分析方法,它是依据其他相关变量(解释变量 158
158 据动态数据揭示系统动态结构和规律性的统计方法,是统计学的一个分支。其基本思想是根 据系统的有限长度的运行记录(样本数据),建立能够比较精确地反映时间序列中所包含的动 态依存关系的数学模型,并借以对系统的未来发展进行预报(时间序列预测)。 “时间序列分析”是概率统计学的一个分支,近二十多年来,无论在理论还是应用方面, 都有迅速的发展,它所提供的动态数据处理方法在国际国内的应用正日渐广泛,而且随着计 算机的普及,生命力越来越旺盛。 最早的时间序列分析可以追溯到 7000 年前的古埃及。古埃及人把尼罗河涨落的情况逐天 记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非 常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿 烂的史前文明。 二、确定性与随机性时间序列分析 时间序列依据其特征,有以下几种表现形式,并产生与之相适应的分析方法。 1)长期趋势变化 受某种基本因素的影响,数据依时间变化时表现为一种确定倾向,它按某种规则稳步地 增长或下降。 使用的分析方法有:移动平均法、指数平滑法、模型拟和法等。 2)季节性周期变化 受季节更替等因素影响,序列依一固定周期规则性的变化,又称商业循环。 采用的方法:季节指数。 3)循环变化 周期不固定的波动变化。 4)随机性变化 由许多不确定因素引起的序列变化。 三、时间序列分析方法 时间序列分析方法按照采用的手段不同可分为数据图法、指标法和模型法三类。 (1)数据图法 即将时间序列数据采用一定的软件绘制变化图(Line、Bar),从而可以直观地了解其变 化的总趋势、变化周期以及异常点、转折点等信息。这一方法常常作为其他方法的切入点。 (2)指标法 指标法是通过计算反映系统变化的一系列核心指标值从而了解系统的内在变化规律。如 反映变化率的发展速度与增长速度。 (3)模型法 模型法是针对不同的时间序列,根据统计与数学方法,建立描述该序列的数学模型,以 此来作预测。最常见的有 ARMA 模型等。 时间序列的基本特征就是研究序列随时间发展的规律。其区别于其他统计分析的重要特 征之一,就是重视顺序的重要性。其次,时间序列分析区别于其他统计分析方法的特征也在 于其所分析的主要依据仅在于时间序列信息本身,它依据其历史变化信息(样本数据)预测 未来的可能状态,不同于其他的方法,如回归分析方法,它是依据其他相关变量(解释变量
或外生变量)的变化来预测本序列的未来。 四、时间序列的应用 时间序列在生产、科研、社会生活和国防建设中,都有着广泛的使用,主要包括 (1)分析时间序列的统计规律性,推断产生时间序列的物理系统的性质找出它的变化规 律性。 (2)根据对时间序列统计规律性的分析,构造拟合它的最佳数学模型,浓缩时间序列的 信息,简化对时间序列的表示。 (3)利用拟合的数学模型预报时间序列未来的可能取值,给出预报结果的精度分析 (4)根据拟合的数学模型模拟出时间序列,用于分析和优化处理。 159
159 或外生变量)的变化来预测本序列的未来。 四、时间序列的应用 时间序列在生产、科研、社会生活和国防建设中,都有着广泛的使用,主要包括: (1)分析时间序列的统计规律性,推断产生时间序列的物理系统的性质,找出它的变化规 律性。 (2)根据对时间序列统计规律性的分析,构造拟合它的最佳数学模型,浓缩时间序列的 信息,简化对时间序列的表示。 (3)利用拟合的数学模型预报时间序列未来的可能取值,给出预报结果的精度分析。 (4)根据拟合的数学模型模拟出时间序列,用于分析和优化处理
第三节时间序列及其特征识别 时间序列与随机过程 如果对地理系统进行长期观测,每隔一定的时间作一个记录,则记录结果可以构成时间 序列( time series)。如果只针对某一个指标进行观测,得到的结果为一元时间序列;如果同 时观测多个指标,则可形成多元时间序列。因此所谓时间序列,时间上就是将某个指标在不 同时间上不同数值,按照时间先后的顺序排列而成的数列,如 回想前面进行线性回归的例子,对山区最大积雪深度连续十年进行观测,得到的便是最 大积雪深度的时间序列,这是一个一元时间序列:相应地,连续十年的灌溉面积也可以构成 元时间序列(见下图5-1、表6.3)。如果将这两个时间序列并行考虑,便是二元时间序列, 属于多元时间序列的范畴了。下面如果不作特别声明,主要讨论一元时间序列。 表63最大积雪深度和灌溉面积的时间序列(10年) 年份(时间) 1971197219731974197519761977197819791980 最大积雪深度(米) 10421.218626423413.516.724.019.1 灌溉面积(千亩)28619.340.535648945029234.1467374 资料来源:苏宏宇、莫力编著. Mathcad2000数据处理应用与实例.北京:国防工业出版社,2001 最大积雪深度 20 19711972197319741975 197819791980 时间(年) 图6.1最大积雪深度和灌溉面积变化的时间序列图式 地理系统的演化过程一般包含两种成分,一是确定性成分,二是随机性成分。确定性成 分具有一定的物理意义,它们又包括周期成分和非周期成分,其坐标曲线具有比较明确的规 则:随机成分则表现得没有规则,其坐标曲线似乎是任意摆动和振荡的轨迹,这种轨迹很难 从物理上进行阐释,只能借助随机过程理论和方法予以分析。随机时间序列通常包括平稳和 非平稳两种情况,二者的性质有很大不同。简而言之,时间序列的分类和构成可以图示如下 (图62)。 160
160 第三节 时间序列及其特征识别 一、时间序列与随机过程 如果对地理系统进行长期观测,每隔一定的时间作一个记录,则记录结果可以构成时间 序列(time series)。如果只针对某一个指标进行观测,得到的结果为一元时间序列;如果同 时观测多个指标,则可形成多元时间序列。因此所谓时间序列,时间上就是将某个指标在不 同时间上不同数值,按照时间先后的顺序排列而成的数列,如 1 x , 2 x ,…, t x ,… 回想前面进行线性回归的例子,对山区最大积雪深度连续十年进行观测,得到的便是最 大积雪深度的时间序列,这是一个一元时间序列;相应地,连续十年的灌溉面积也可以构成 一元时间序列(见下图 5-1、表 6.3)。如果将这两个时间序列并行考虑,便是二元时间序列, 属于多元时间序列的范畴了。下面如果不作特别声明,主要讨论一元时间序列。 表 6.3 最大积雪深度和灌溉面积的时间序列(10 年) 年份(时间) 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 最大积雪深度 (米) 15.2 10.4 21.2 18.6 26.4 23.4 13.5 16.7 24.0 19.1 灌溉面积 (千亩) 28.6 19.3 40.5 35.6 48.9 45.0 29.2 34.1 46.7 37.4 资料来源:苏宏宇、莫力编著.Mathcad2000 数据处理应用与实例.北京:国防工业出版社,2001 图 6.1 最大积雪深度和灌溉面积变化的时间序列图式 地理系统的演化过程一般包含两种成分,一是确定性成分,二是随机性成分。确定性成 分具有一定的物理意义,它们又包括周期成分和非周期成分,其坐标曲线具有比较明确的规 则;随机成分则表现得没有规则,其坐标曲线似乎是任意摆动和振荡的轨迹,这种轨迹很难 从物理上进行阐释,只能借助随机过程理论和方法予以分析。随机时间序列通常包括平稳和 非平稳两种情况,二者的性质有很大不同。简而言之,时间序列的分类和构成可以图示如下 (图 6.2)
周期性序列简单周期 复合周期 「准周期序列 确定型 「趋势型序列 地理时间序 非周期序列 暂态序列跳跃型序列 突变型序列 随机型平稳序列相依型序列 独立型序列 非平稳序列 图62地理时间序列的分类与构成 地理系统时间序列的周期性一般与地球的公转、太阳活动和月球围绕有关,因此自然地 理的许多现象如江河的水位、生物的发育都具有一定的季节性。与此相关,如多人文地理现 象由于生态环境的季节变化也表现出明确的周期规律,例如风景旅游地的游客人数便具有季 节性特征。认识自然变化的周期性规律有时是非常重要的,例如,早在80年代,紫金山天文 台就有人研究发现,1887年、1909年、1931年、1954年、1975年,我国长江、黄淮海流域 都曾发生特大洪水,时间间隔平均约为22年,与太阳黑子的22年周期有关,由此可以推断, 1997年前后还会发生特大洪水。结果1998年中国再次洪水泛滥成灾。如果我国政府部门早 点重视有关研究,在抗洪抢险的也不至于损失如此惨重! 有些周期变化是系统内在的相互作用导致的,生物与环境的关系便可导致某种周期变化 的规律。设想一个孤立的小岛,那里有茂盛的牧草,发育了一群以草为生的野兔。由于牧草 很多,野兔必然快速繁殖;兔子太多,供不应求,又会导致牧草减少,部分兔子将被饿死 于是牧草又会增多。于是,就会形成如下相互作用关系: 草多→兔多→草少→兔少→草多→兔多→草少→兔少 将上面序列演化关系分解,便是 草多→草少→草多→草少 兔多→兔少→兔多→兔少 显然,对兔子和牧草,都会形成周期性时间序列,这种序列通常隐含着深刻的系统演化机制 在地理研究中,单一周期的时间序列是比较少见的,通常是多种周期叠加的结果:既有 地球一太阳一月球相互作用的外在影响,又有地理系统内部的某种相互作用导致的内在节律。 多种周期叠加的结果,使得时间序列的周期性很不明确,需要对周期进行分解,有时需要进 行某种数学变换(如功率谱分析)。 地理系统的时间序列更多的是非周期的,其中一类具有准周期性(或称“拟周期”),即近 似周期的。一般认为,准周期的形成与多种周期成分不可通约有关,如太阳、月球同时作用 与地球上的潮汐,太阳周期与地球周期不可同约,再一类就是暂态序列,没有周期性,但表 现出某种趋势、跳跃或突变特征。当序列的统计参数如均值、方差和相关系数等呈现系统而 又连续的增加和减少时,称为趋势数据序列。当然,上述参数变化是由系统自身性质决定 而非随机抽样波动或观测资料误差引起。跳跃是时间序列的急剧变换形式,反映地理系统从 一种状态过渡到另外一种状态,此时统计数据的均值、方差、和相关系数发生不连续变化。 61
161 非平稳序列 独立型序列 相依型序列 平稳序列 随机型 突变型序列 跳跃型序列 趋势型序列 暂态序列 准周期序列 非周期序列 复合周期 简单周期 周期性序列 确定型 地理时间序列 图 6.2 地理时间序列的分类与构成 地理系统时间序列的周期性一般与地球的公转、太阳活动和月球围绕有关,因此自然地 理的许多现象如江河的水位、生物的发育都具有一定的季节性。与此相关,如多人文地理现 象由于生态环境的季节变化也表现出明确的周期规律,例如风景旅游地的游客人数便具有季 节性特征。认识自然变化的周期性规律有时是非常重要的,例如,早在 80 年代,紫金山天文 台就有人研究发现,1887 年、1909 年、1931 年、1954 年、1975 年,我国长江、黄淮海流域 都曾发生特大洪水,时间间隔平均约为 22 年,与太阳黑子的 22 年周期有关,由此可以推断, 1997 年前后还会发生特大洪水。结果 1998 年中国再次洪水泛滥成灾。如果我国政府部门早 点重视有关研究,在抗洪抢险的也不至于损失如此惨重! 有些周期变化是系统内在的相互作用导致的,生物与环境的关系便可导致某种周期变化 的规律。设想一个孤立的小岛,那里有茂盛的牧草,发育了一群以草为生的野兔。由于牧草 很多,野兔必然快速繁殖;兔子太多,供不应求,又会导致牧草减少,部分兔子将被饿死, 于是牧草又会增多。于是,就会形成如下相互作用关系: 草多→兔多→草少→兔少→草多→兔多→草少→兔少…… 将上面序列演化关系分解,便是: 草多→草少→草多→草少…… 兔多→兔少→兔多→兔少…… 显然,对兔子和牧草,都会形成周期性时间序列,这种序列通常隐含着深刻的系统演化机制。 在地理研究中,单一周期的时间序列是比较少见的,通常是多种周期叠加的结果:既有 地球—太阳—月球相互作用的外在影响,又有地理系统内部的某种相互作用导致的内在节律。 多种周期叠加的结果,使得时间序列的周期性很不明确,需要对周期进行分解,有时需要进 行某种数学变换(如功率谱分析)。 地理系统的时间序列更多的是非周期的,其中一类具有准周期性(或称“拟周期”),即近 似周期的。一般认为,准周期的形成与多种周期成分不可通约有关,如太阳、月球同时作用 与地球上的潮汐,太阳周期与地球周期不可同约,再一类就是暂态序列,没有周期性,但表 现出某种趋势、跳跃或突变特征。当序列的统计参数如均值、方差和相关系数等呈现系统而 又连续的增加和减少时,称为趋势数据序列。当然,上述参数变化是由系统自身性质决定, 而非随机抽样波动或观测资料误差引起。跳跃是时间序列的急剧变换形式,反映地理系统从 一种状态过渡到另外一种状态,此时统计数据的均值、方差、和相关系数发生不连续变化