时间序列分析简介
时间序列分析简介
1.1基本概念 时间序列所研究的是时间上的相关结构。它的应用广泛,从海洋学到金融学 都是它的应用范围。著名的CAPM模型(资本资产定价模型)和随机波动模型就是 含有时间序列成份的金融模型的例子。当我们考虑一时间序列时,我们通常考虑 个数值的集合{X:t=1…,m},其中下标t表示数据X被观测到的时间。虽然直观 上很清楚,我们还是来详细描述一下X,的一系列非标准特性 非等距数据(缺损数据)。例如,若时间序列是某一证券的日收益率,则在节假 日等非交易日里就没有数据可得了 连续时间序列。在许多物理现象中,令人感兴趣的基本物理量往往是由连续演 变的机制所控制的,因而观测到的数据就应该用连续时间序列K(t)来建模。在金融 领域,我们可以把滴嗒一声记录一下所得数据看成是对市场连续演变的一种良好逼近
1.1 基本概念 时间序列所研究的是时间上的相关结构。它的应用广泛,从海洋学到金融学 都是它的应用范围。著名的 CAPM 模型(资本资产定价模型)和随机波动模型就是 含有时间序列成份的金融模型的例子。当我们考虑一时间序列时,我们通常考虑一 个数值的集合X t n t : 1, , = ,其中下标 t 表示数据 Xt 被观测到的时间。虽然直观 上很清楚,我们还是来详细描述一下 Xt 的一系列非标准特性。 非等距数据(缺损数据)。例如,若时间序列是某一证券的日收益率,则在节假 日等非交易日里就没有数据可得了。 连续时间序列。在许多物理现象中,令人感兴趣的基本物理量往往是由连续演 变的机制所控制的,因而观测到的数据就应该用连续时间序列 X(t)来建模。在金融 领域,我们可以把滴嗒一声记录一下所得数据看成是对市场连续演变的一种良好逼近
总计性。观测到的序列可以表示一段时间上基本数量的累加。例如,日 收益可看成是同一天内滴嗒一声记录一下的收益的总和 重复观测的序列。这数据还可以表示同一个量在不同的观测对象上重复 测量的结果。例如,我们可以监察在某一期间内某一超市连锁店的一群顾客 中的每一个人的每周总消费额。 多元时间序列。此时X不是一维纯量,而是一个向量,其每一个分量都 各自代表一个时间序列。例如,一个由p支股票构成的投资组合其收益率可 表示为X,=(X1…,Xn),其中每一个X,i=1,…,p,各代表此投资组合中 支股票的收益率。在此情形,我们不仅对每一支股票内的序相关结构感兴趣, 而且也对不同股票间的横向相关结构感兴趣
总计性。 观测到的序列可以表示一段时间上基本数量的累加。例如,日 收益可看成是同一天内滴嗒一声记录一下的收益的总和。 重复观测的序列。 这数据还可以表示同一个量在不同的观测对象上重复 测量的结果。例如,我们可以监察在某一期间内某一超市连锁店的一群顾客 中的每一个人的每周总消费额。 多元时间序列。此时 Xt 不是一维纯量,而是一个向量,其每一个分量都 各自代表一个时间序列。例如,一个由 p 支股票构成的投资组合其收益率可 表示为 1 ( , , ) Xt t pt = X X ,其中每一个 , 1, , , X i p it = 各代表此投资组合中一 支股票的收益率。在此情形,我们不仅对每一支股票内的序相关结构感兴趣, 而且也对不同股票间的横向相关结构感兴趣
非线性性,非平稳性和异方差性。实践中遇到的许多时间序列可能具有非 线性行为。有时对它们进行变换是有帮助的,但我们常常不得不去建立复杂费 神的模型以说明这种非标准的特性。例如,股票收益率的非对称行为推动了对 GARCH模型的研究。 虽然这些特性是重要的,但本书主要讨论标准的纯量时间序列。只有对分 析等距纯量时间序列的技术和困难之处有透彻的理解后,我们才能够处理非标 准特性的一些问题。 在经典统计中,我们通常假定ⅹ是独立的。在时间序列领域,X通常是序 相关的。时间序列分析的目的之一就是利用这种序相关结构去帮助我们建立更 好的模型。下面的例子在置信区间估计方面说明了这一点
非线性性,非平稳性和异方差性。实践中遇到的许多时间序列可能具有非 线性行为。有时对它们进行变换是有帮助的,但我们常常不得不去建立复杂费 神的模型以说明这种非标准的特性。例如,股票收益率的非对称行为推动了对 GARCH 模型的研究。 虽然这些特性是重要的,但本书主要讨论标准的纯量时间序列。只有对分 析等距纯量时间序列的技术和困难之处有透彻的理解后,我们才能够处理非标 准特性的一些问题。 在经典统计中,我们通常假定 X 是独立的。在时间序列领域, X 通常是序 相关的。时间序列分析的目的之一就是利用这种序相关结构去帮助我们建立更 好的模型。下面的例子在置信区间估计方面说明了这一点
例1.1设X,是由以下模型产生的 X=+a1-a1,a1~N(0,1)id 显然,E(X)=和varx,=1+02。因此, coV(X, X-=e(x-u(xi-k-u) E(a1-ba1-1)(a1-k-ba1-k1) k=1 ={1+2,k=0, 0 否则 令X=∑X/。由公式 var(∑x)=∑va(x)+∑∑cov(x,X)
例 1.1 设 Xt 是由以下模型产生的: 1 , ~N(0,1) i.i.d. X a a a t t t t = + − − 显然,E( ) Xt = 和 2 var 1 Xt = + 。因此, cov( , ) E( )( ) X X X X t t k t t k − − = − − E( )( ) t t t k t k 1 1 = − − a a a a − − − − 2 , 1, 1 , 0, 0, k k − = = + = 否则. 令 1 ( ) n t t X X n = = 。由公式 1 2 2 1 1 1 1 1 1 2 var( ) var( ) cov( , ), n n n t t t t j t t t j X X X X n n n − = = = = = +
容易看出 a-= varX n(1+62)-=2(n-1)6 (1+62-2 (1-)2 26 因此,ⅹN(A,G2)。于是的约95%的置信区间(CI是 6 X± 如=0,这CI就成为x±2,此与独立同分布Gi.d)情形重合。0=0 和O≠0时置信区间之间的差异可表白示为L(O)=|(1-0
容易看出 2 var X = X 2 2 2 1 2 n n (1 ) ( 1) n n = + − − 2 2 1 2 (1 2 ) 1 2 (1 ) n n n n = + − + = − + 因此, 2 ~N( , ) X X 。于是 的约 95%的置信区间(CI)是 ( ) 1 2 2 2 2 2 1 X X X n n = − + 。 如 = 0,这 CI 就成为 2 X , n 此与独立同分布(i.i.d.)情形重合。 = 0 和 0时置信区间之间的差异可表白示为 ( ) ( ) 1 2 2 2 L 1 n = − +
表1.1n=50时置信区间的长度 L() 2 0.5 1.34 0 0.5 0.14 表1.1列出了n=50时此差异的数值。例如,若θ=1而假 如我们使用θ=0时的置信区间来代替θ=1时的置信区间,那 么这错误地建立起来的置信区间比其应有的长度长得多。在本 例这种情形,模型给出的时序相关结构帮助产生了更好的推断
表 1.1 n = 50时置信区间的长度 L( ) -1 ( ) 1 2 2 1 4 2 50 L − = − -0.5 1.34 0 1 0.5 0.45 1 0.14 表 1.1 列出了n = 50时此差异的数值。例如,若 =1而假 如我们使用 = 0时的置信区间来代替 =1时的置信区间,那 么这错误地建立起来的置信区间比其应有的长度长得多。在本 例这种情形,模型给出的时序相关结构帮助产生了更好的推断
例1.2作为第二个例子,我们来考虑Kao和 Shumaker(1999讨论过的股票 类型适时调配模型。在他们的文章里,作者试图用几个基本量去解释价值型 股票与增长型股票间的利差。其中,最令人感兴趣的变量是在他们的文章里 图4所报告的收益率差。这个变量解释了几乎30%的价值型股票与增长型股 票间的利差的变差并暗示收益率差很可能是富含信息的回归子。这个数据集 的进一步描述请看他们的文章。我们这里重复这个特别的分析并把观测的时 间顺序这个因素考虑进去 现在,我们把注意力集中在重复制作Kao和 Shumaker(1999)的图4上。其 图形如下
例 1.2 作为第二个例子, 我们来考虑 Kao 和 Shumaker(1999)讨论过的股票 类型适时调配模型。在他们的文章里,作者试图用几个基本量去解释价值型 股票与增长型股票间的利差。其中,最令人感兴趣的变量是在他们的文章里 图 4 所报告的收益率差。这个变量解释了几乎 30%的价值型股票与增长型股 票间的利差的变差并暗示收益率差很可能是富含信息的回归子。这个数据集 的进一步描述请看他们的文章。我们这里重复这个特别的分析并把观测的时 间顺序这个因素考虑进去。 现在,我们把注意力集中在重复制作 Kao 和 Shumaker(1999)的图 4 上。其 图形如下:
Scatterplot of Style Spreads(Subsequent 12-month Value Rotum-Growth Retum) against Earnings-Yiold Gap, Jan78-ung7 8 1m90o.cD bOo 巴E 0 020h0 1o04OO 1H80gO 40 0 Eamings-Yield Gap
正如从图11所见到的,散点图可分离成两块云状的部分, 部分属于前两年的数据,另一部分属于接下来年份的数 据。当把时间因素考虑进去时,我们发现R2=03 似乎完全由位于图1.1右下角的79年至80年间的数据决定 相应地,来自收益率差的如此高的解释力总的来看则似乎 是不正确的。这个例子表明当时间因素没有恰当地考虑进 去时,重要的信息就可能失去
正如从图1.1所见到的, 散点图可分离成两块云状的部分, 一部分属于前两年的数据,另一部分属于接下来年份的数 据。当把时间因素考虑进去时,我们发现 似乎完全由位于图1.1右下角的79年至80年间的数据决定。 相应地,来自收益率差的如此高的解释力总的来看则似乎 是不正确的。这个例子表明当时间因素没有恰当地考虑进 去时,重要的信息就可能失去。 2 R = 0.3