中国科学A辑:数学2009年第39卷第3期:373~384 www.scichina.com math.scichina.com ◇中阳科烂〉条志社 基于经验似然的Value-at-Risk模型的评价 万法 魏正红①②*,温松桥①②,朱力行@ ①深圳大学数学与计算科学学院,深圳518060 。香港浸会大学数学系。香港 E-mail:weizhenghong2006@yahoo.com.cn 摘要Value-at-Risk(VaR)是度量市场风险的一个基本工具,自从VaR概念提出以来】 涌现出大量方法用于VR估计,因此在统计意义下,如何检验这些方法的有效性,以及如 何比较不同VR模型从而选择出最好的方法,就成为人们非常关注的问愿.本文提出了利 用经脸似然法来评估和比较不同的Value-.at-Risk模型.模拟和实证分析表明经验似然方法 比已有的方法有效和稳健。 关健词 Value--at-Risk波动率经验似然设定检验非套检验 MSC(2000)主题分类62G10,62P20,91B30 1引言 风险管理是金融机构、金融监管当局、非金融机构和资产管理公司非常关注的重要问 题.Value--at-Risk(VaR)是一种度量某一个金融资产的市场风险的方法.它是指当市场正常 波动时,在一定的持有期和置信水平下,某一金融资产所面临的最大可能的损失.关于VR 的详细介绍,可参见综述文献山以及专著2- 风险管理领域的发展非常迅速,酒现出了大量的VR的估计方法.目前已有的方法大 致包括六类.最简单的方法是历史模拟法(History Simulation),该方法是利用基于历史数据 的样本分位数去估计VaR,见文献5,61.另一类普遍使用的方法是基于GARCH模型的参 数估计方法,见文献[亿,8.极值理论是测量极端市场情况下风险损失的另一种方法,它是基 于最小或最大次序统计量的分布,焦点在分布的尾部概率,关于这种方法见文献9,10.第四 类方法是条件自回归Value-at-Risk模型,简称为CAViaR模型,该方法是由Engle等提 出的,主要思想是将研究的问题由收益的分布转为直接对分位数的研究。他们用自回归的方 法确定分位数随时间的变化规律.文中使用了Koenker等提出的分位数回归的方法来估计未 知的参数.为了扩展模型的使用范围,Fan等到提出了时间相依的半参方法,这个方法是 Cham等提出的用于动态期限结构的时间齐性半参模型的推广.最后一类方法是Chn 引用格式:魏正红,温松桥,朱力行.基于经验似然的Vaue-a-R1sk模型的评价方法.中同科学A,209,393373 g2882bi&ogbaadmhaiomadVaaetikmadsacan
中国科学 A 辑: 数学 2009 年 第 39 卷 第 3 期 : 373 ∼ 384 www.scichina.com math.scichina.com 基于经验似然的 Value-at-Risk 模型的评价 方法 魏正红 ① ②∗, 温松桥 ① ②, 朱力行 ② ① 深圳大学数学与计算科学学院, 深圳 518060 ② 香港浸会大学数学系, 香港 * E-mail: weizhenghong2006@yahoo.com.cn 收稿日期: 2007-10-29; 接受日期: 2008-11-20 香港研究局研究基金 (批准号: HKBU 2030/07P) 和广东省自然科学基金 (批准号: 2008276) 资助项目 摘要 Value-at-Risk (VaR) 是度量市场风险的一个基本工具. 自从 VaR 概念提出以来, 涌现出大量方法用于 VaR 估计, 因此在统计意义下, 如何检验这些方法的有效性, 以及如 何比较不同 VaR 模型从而选择出最好的方法, 就成为人们非常关注的问题. 本文提出了利 用经验似然法来评估和比较不同的 Value-at-Risk 模型. 模拟和实证分析表明经验似然方法 比已有的方法有效和稳健. 关键词 Value-at-Risk 波动率 经验似然 设定检验 非嵌套检验 MSC(2000) 主题分类 62G10, 62P20, 91B30 1 引言 风险管理是金融机构、金融监管当局、非金融机构和资产管理公司非常关注的重要问 题. Value-at-Risk (VaR) 是一种度量某一个金融资产的市场风险的方法. 它是指当市场正常 波动时, 在一定的持有期和置信水平下, 某一金融资产所面临的最大可能的损失. 关于 VaR 的详细介绍, 可参见综述文献 [1] 以及专著 [2–4]. 风险管理领域的发展非常迅速, 涌现出了大量的 VaR 的估计方法. 目前已有的方法大 致包括六类. 最简单的方法是历史模拟法 (History Simulation), 该方法是利用基于历史数据 的样本分位数去估计 VaR, 见文献 [5, 6]. 另一类普遍使用的方法是基于 GARCH 模型的参 数估计方法, 见文献 [7, 8]. 极值理论是测量极端市场情况下风险损失的另一种方法, 它是基 于最小或最大次序统计量的分布, 焦点在分布的尾部概率, 关于这种方法见文献 [9, 10]. 第四 类方法是条件自回归 Value-at-Risk 模型, 简称为 CAViaR 模型, 该方法是由 Engle 等 [11] 提 出的, 主要思想是将研究的问题由收益的分布转为直接对分位数的研究. 他们用自回归的方 法确定分位数随时间的变化规律. 文中使用了 Koenker 等提出的分位数回归的方法来估计未 知的参数. 为了扩展模型的使用范围, Fan 等 [13] 提出了时间相依的半参方法, 这个方法是 Chan 等 [14] 提出的用于动态期限结构的时间齐性半参模型的推广. 最后一类方法是 Chen 引用格式: 魏正红, 温松桥, 朱力行. 基于经验似然的 Value-at-Risk 模型的评价方法. 中国科学 A, 2009, 39(3): 373– 384 Wei Z H, Wen S Q, Zhu L X. Empirical likelihood-based evaluations of Value at Risk models. Sci China Ser A, 2009, 52, DOI: 10.1007/s11425-009-0050-6
魏正红等:基于经验似然的Value-at-.Risk模型的评价方法 等可提出的基于特殊的密度函数的核密度估计法,该方法可以解决一些相依问题.Cm 等同利用平滑的经验似然构造了弱相依过程的VR的置信区间.由于该方法依赖于分块 样本,虽然可以处理相依数据,但是窗宽的选择却是 个挑战性的问题 对银行和监管当局来说.VaR的估计方法无疑是非常重要的.但是评估不同VaR模型 的准确性同样是必须解决的问题.首先,给定一个VR的估计方法,风险管理者如何检验这 个估计模型的准确性?其次,给定两个不同的VaR估计模型,比如 一个是GARCH模型,另 一个是隐含波动率模型,那么在统计意义上如何比较这两个模型,从而选择出一个好的模型? 目前基干假设检验的VaR模型的评估方法有三类.每个评估方法的零假设都是VaR模型 准确地估计了实际的VaR.第 一个检验方法是无条件覆盖检验,第二个是条件覆盖检验,分别 由Kupiec1可和Christoffersen1s提出.这两个检验方法都是基于例外(实际损失超过VaR 的模型检验.它们仅仅考越了整个分布的一一个百分点.所以Crnkovic等1可提出第三个检路 方法,称为分布预测检验。他们认为应该以整体概率分布函数,而不是仅仅以 一点的概 特性为基础来评估顶测的质量.在这些检验中,如果零假设被拒绝,则VaR的预测值将不能 准确地预测实际的VaR.也就是说VaR的估计摸型是“不正确的”:如果零假设不被拒绝,侧 Va的估计模型“可以认为是正确的”.由于这些检验的功效往往很低,也就是常常将不正 确的模型误判为正确的模型.Lopez2可提出了一种不基于假设检验的VaR模型的评估方法 该方法使用一种非统计的预测评价标准,其基本思想是指定一个预测的损失函数,使用该损 失函数对VaR模型的预测结果打分,根据VaR模型的得分评估其准确性,得分越高,模型的 预测效果越差,如果得分太高则拒绝该VR模型. 在Kullback-Leibler信息准则下,Christoffersen等2提出了设定检验和非嵌套检验,并 利用实际数据作了实证分析,但却没有对这些方法进行必要的模拟.一般来说,为了全面地 评估一种方法,常规的模拟是不可缺少的.本文中,我们对Christoffersen的两种检验方法做 了模拟,发现这种渐进方法不是总能得到希望的结果,因此,我们在同样的条件下考虑另 种方法,即经验似然法.经验似然法由Owem2,2网首先提出并用于构造置信区间,Ha等P 总结了该方法与传统的统计方法相比所具有的一些优点:如.用经验似然法构造置信区间时 置信区间的形状由数据自行决定,域保特性,变换不变性.还有Bartlett纠偏性等.由于这些 原因,经验似然方法被应用到各种统计模型和众多领域,如均值的光滑函数的应用问,非参 数密度和回归参数的估计26-2网,分位数估计2网等等.关于经验似然方法及其应用的详细 介绍.请参阅Own的综合性专著301l.模似和实证分析表明经验似然方法比已有的方法有 效和稳健。 本文的结构如下.在第2节,我们提出了基于经验似然的对VR模型进行检验和比较 的新方法,并详细介绍了这种方法是如何对VR模型进行检验和比较的.第3节中给出这 种方法的模拟和实证结果.最后在附录中我们给出主要定理的证明。 2基于经验似然方法的Value-at-.Risk模型的检验和比较 关于VaR模型的检验和比较,包括Christoffersen在内的一些学者已经作了一些研究 但是我们的数值研究表明这些方法不是总能给出希望的结果(参见下一节的模拟结果)在这 一节里我们将提出另一个方法一经验似然方法.我们将分别讨论设定检验和非嵌套检验. 374
魏正红等: 基于经验似然的 Value-at-Risk 模型的评价方法 等 [15] 提出的基于特殊的密度函数的核密度估计法, 该方法可以解决一些相依问题. Chen 等 [16]利用平滑的经验似然构造了弱相依过程的 VaR 的置信区间. 由于该方法依赖于分块 样本, 虽然可以处理相依数据, 但是窗宽的选择却是一个挑战性的问题. 对银行和监管当局来说, VaR 的估计方法无疑是非常重要的, 但是评估不同 VaR 模型 的准确性同样是必须解决的问题. 首先, 给定一个 VaR 的估计方法, 风险管理者如何检验这 个估计模型的准确性? 其次, 给定两个不同的 VaR 估计模型, 比如一个是 GARCH 模型, 另 一个是隐含波动率模型, 那么在统计意义上如何比较这两个模型, 从而选择出一个好的模型? 目前基于假设检验的 VaR 模型的评估方法有三类, 每一个评估方法的零假设都是 VaR 模型 准确地估计了实际的 VaR. 第一个检验方法是无条件覆盖检验, 第二个是条件覆盖检验, 分别 由 Kupiec[17] 和 Christoffersen[18] 提出. 这两个检验方法都是基于例外 (实际损失超过 VaR) 的模型检验, 它们仅仅考虑了整个分布的一个百分点, 所以 Crnkovic 等 [19] 提出第三个检验 方法, 称为分布预测检验. 他们认为应该以整体概率分布函数, 而不是仅仅以某一点的概率 特性为基础来评估预测的质量. 在这些检验中, 如果零假设被拒绝, 则 VaR 的预测值将不能 准确地预测实际的 VaR, 也就是说 VaR 的估计模型是 “不正确的”; 如果零假设不被拒绝, 则 VaR 的估计模型 “可以认为是正确的”. 由于这些检验的功效往往很低, 也就是常常将不正 确的模型误判为正确的模型, Lopez[20] 提出了一种不基于假设检验的 VaR 模型的评估方法, 该方法使用一种非统计的预测评价标准, 其基本思想是指定一个预测的损失函数, 使用该损 失函数对 VaR 模型的预测结果打分, 根据 VaR 模型的得分评估其准确性, 得分越高, 模型的 预测效果越差, 如果得分太高则拒绝该 VaR 模型. 在 Kullback-Leibler 信息准则下, Christoffersen 等 [21] 提出了设定检验和非嵌套检验, 并 利用实际数据作了实证分析, 但却没有对这些方法进行必要的模拟. 一般来说, 为了全面地 评估一种方法, 常规的模拟是不可缺少的. 本文中, 我们对 Christoffersen 的两种检验方法做 了模拟, 发现这种渐进方法不是总能得到希望的结果, 因此, 我们在同样的条件下考虑另一 种方法, 即经验似然法. 经验似然法由 Owen[22, 23] 首先提出并用于构造置信区间, Hall 等 [24] 总结了该方法与传统的统计方法相比所具有的一些优点: 如, 用经验似然法构造置信区间时, 置信区间的形状由数据自行决定, 域保持性, 变换不变性, 还有 Bartlett 纠偏性等. 由于这些 原因, 经验似然方法被应用到各种统计模型和众多领域, 如均值的光滑函数的应用 [25], 非参 数密度和回归参数的估计 [26−28], 分位数估计 [29] 等等. 关于经验似然方法及其应用的详细 介绍, 请参阅 Owen 的综合性专著 [30]. 模拟和实证分析表明经验似然方法比已有的方法有 效和稳健. 本文的结构如下. 在第 2 节, 我们提出了基于经验似然的对 VaR 模型进行检验和比较 的新方法, 并详细介绍了这种方法是如何对 VaR 模型进行检验和比较的. 第3节中给出这 种方法的模拟和实证结果. 最后在附录中我们给出主要定理的证明. 2 基于经验似然方法的 Value-at-Risk 模型的检验和比较 关于 VaR 模型的检验和比较, 包括 Christoffersen 在内的一些学者已经作了一些研究. 但是我们的数值研究表明这些方法不是总能给出希望的结果 (参见下一节的模拟结果). 在这 一节里我们将提出另一个方法 — 经验似然方法. 我们将分别讨论设定检验和非嵌套检验. 374
中国科学A辑:数学第39卷第3期 2.1基于经验似然方法的设定检验 设S,是t时刻的资产价格,若 是t时刻资产的对数收益,根据VaR的定义,它是指在一定的持有期r和置信水平1一p下, 某一金融资产所面临的最大可能的损失(在本篇文章中,我们取?=1).更准确地说,VR, 就是下列方程的解 Pr≤VaRlw-i)= (2.1) 其中,亚:=a(S,s≤)表示t时刻的历史信息. 实际中,金融资产的收益往往具有被广泛介绍的三个特征:(波动的群聚性,()高峰 厚尾的分布,(的)收益带有偏态特性,而且可能是时变的.考虑到这些因素,我们引入下面更 一般的模型 rt=ut+01Et 2.2) 这里:和1都是重-1-可测的,1是均值为0,方差为1的随机变量.记给定亚,-1的条件 下,r的条件分布函数为F(w)=P(≤:-),Hw.则根据(2.1)式和上述的位置刻度 模型,我们得到 VaR()=F(p)=4+3a, 这里B是的分位数,即P(:≤)=卫.不失一般性,我们可以假设4=0(例如,首 先对原序列零均值化)。 由于(2.1)可以重新写成下列形式 E(Ir VaR(8))-plv:-1)=0. (2.3) 如果{24-1,4-2,小是亚-1可测,这里-1是t-1时刻的信息集,那么由(2.3)可以导出 Efrt,3)=:E{(I{r:≤VaR(3)}-p)k(at-1,t-2,.)}=0, (2.40 这里4=,4-4-2f,)=(≤VaR(}-pk-14-2随机变量序 列{,一1,,-2,.,}指的是在计量经济文献中常用的工具变量.在后面的模拟分析中,我们采 用的是波动率的一阶滞后作为工具变量.向量值函数k(是最简单的截距为0斜率为1的 线性函数。 定义=√fz,3),如果VaR的估计模型是正确的,那么对任意的y∈+1,我们都 有EY=0,因此我们构造如下基于的经验似然, L(g,)=maxΠp 满足条件 =1,=0 =1 根据标准的经验似然的推导过程可以证明(见文献30》 P:=T1+阿 375
中国科学 A 辑: 数学 第 39 卷 第 3 期 2.1 基于经验似然方法的设定检验 设 St 是 t 时刻的资产价格, 若 rt = log St − log St−1 = log St St−1 是 t 时刻资产的对数收益, 根据 VaR 的定义, 它是指在一定的持有期 τ 和置信水平 1 − p 下, 某一金融资产所面临的最大可能的损失 (在本篇文章中, 我们取 τ = 1). 更准确地说, VaRt 就是下列方程的解 P(rt VaRt|Ψt−1) = p, (2.1) 其中, Ψt = σ(Ss, s t) 表示 t 时刻的历史信息. 实际中, 金融资产的收益往往具有被广泛介绍的三个特征: (i) 波动的群聚性, (ii) 高峰 厚尾的分布, (iii) 收益带有偏态特性, 而且可能是时变的. 考虑到这些因素, 我们引入下面更 一般的模型 rt = μt + σtεt, (2.2) 这里 μt 和 σt 都是 Ψt−1-可测的, εt 是均值为 0, 方差为 1 的随机变量. 记给定 Ψt−1 的条件 下, rt 的条件分布函数为 Ft(w) = P (rt w|Ψt−1), ∀ w. 则根据 (2.1) 式和上述的位置-刻度 模型, 我们得到 VaRt(β) = F −1 t (p) := μt + βσt, 这里 β 是 εt 的 pth 分位数, 即 P(εt β) = p. 不失一般性, 我们可以假设 μt =0(例如, 首 先对原序列零均值化). 由于 (2.1) 可以重新写成下列形式 E(I{rt VaRt(β)} − p|Ψt−1)=0, (2.3) 如果 {zt−1, zt−2,...} 是 Ψt−1-可测, 这里 Ψt−1 是 t−1 时刻的信息集, 那么由 (2.3) 可以导出 Ef(xt, β) =: E {(I{rt VaRt(β)} − p) k(zt−1, zt−2,...)} = 0, (2.4) 这里 xt = (rt, zt−1, zt−2,...), f(xt, β)=(I{rt VaRt(β)} − p)k(zt−1, zt−2,...). 随机变量序 列 {zt−1, zt−2,...} 指的是在计量经济文献中常用的工具变量. 在后面的模拟分析中, 我们采 用的是波动率的一阶滞后作为工具变量. 向量值函数 k(·) 是最简单的截距为 0 斜率为 1 的 线性函数. 定义 Vt = γ f(xt, β), 如果 VaR 的估计模型是正确的, 那么对任意的 γ ∈ Rd+1, 我们都 有 EVt =0. 因此我们构造如下基于 Vt 的经验似然, L(β, γ) = max T i=1 pi, 满足条件 T i=1 pi = 1, T i=1 piVi = 0. 根据标准的经验似然的推导过程可以证明 (见文献 [30]) pt = 1 T (1 + λVt) , 375
魏正红等:基于经验似然的Value-at-Risk模型的评价方法 这里入满足条件 品0 那么,对数经验似然比(乘以一2)是 9:=-2ogΠTpm)=2∑og(1+A). 上述的经验似然比9包含两个未知的参数日和?,这两个参数可以用下面的方法估计倒 (房,m)=arg,) gmiu7∑epf,. (2.5 上述的估计是基于这样的直觉:如果估计模型是正确的,VaR估计应该最小化Kullback Leibler Information Criterion (KLIC). =f红,r,和p9=2∑1og(1+A). 这样我们得到下面的定理,定理的证明见附录 定理2.1在Christoffersen等的假设1-9下,对数经验似然比(乘以-2) p9=2∑1og1+A的一axi,依分布 这里a-a'/EV,a2。'-limT-eVar(∑1).等价地 ap9一x好,依分布, 上述定理表明,一个较大的a~19值表明采用的模型可能是错误的.在应用定理2.1 进行设定检验之前,我们首先需要估计未知的尺度参数a.注意到o。'=imr一,这里 =(2 1 =∑c, 台台 -Ya()+(T-jCw(V.V.) (2.6) 最后一个等式是基于序列的平稳性.在实际中我们可以用(2.6)式的前r项的相应的样 本版本去近似的估计宁,为此我们定义 =7-+--, 这里了=∑T,T.但是为了保证我们有足够的数据去估计相应的协方差,r不能取得 太大.在后面的模拟研究中,我们发现上述估计量对r的选择是相当不敏感的.当然我们也 可以用别的方法去估计',但是相应的估计的相合性需要作进一步的研究。现在我们定义 a=说x/(T-1∑-?),那么如果ap1>x(a),我们就拒绝零假设。 37
魏正红等: 基于经验似然的 Value-at-Risk 模型的评价方法 这里 λ 满足条件 T t=1 Vt 1 + λVt = 0. 那么, 对数经验似然比 (乘以 −2) 是 ρ˜ (1) T := −2 log T t=1 (T pt)=2 T t=1 log(1 + λVt). 上述的经验似然比 ρ˜ (1) T 包含两个未知的参数 β 和 γ , 这两个参数可以用下面的方法估计 [31], (βˆT , γˆT ) = arg max β min γ MT (β, γ) = arg max β min γ 1 T T t=1 exp (γ f(xt, β)). (2.5) 上述的估计是基于这样的直觉: 如果估计模型是正确的, VaR 估计应该最小化 Kullback Leibler Information Criterion (KLIC). 设 Vˆt = ˆγ T f(xt, βˆT ), 和 ρ (1) T = 2 T t=1 log(1 + λVˆt). 这样我们得到下面的定理, 定理的证明见附录. 定理 2.1 在 Christoffersen 等 [21] 的假设 1–9 下, 对数经验似然比 (乘以 −2) ρ (1) T = 2 T t=1 log(1 + λVˆt) −→ aχ2 1, 依分布. 这里 a = σ2 ∞ /EV 2 1 , σ2 ∞ = limT→∞ Var( √ 1 T T t=1 Vt). 等价地, a−1ρ (1) T −→ χ2 1, 依分布. 上述定理表明, 一个较大的 a−1ρ(1) T 值表明采用的模型可能是错误的. 在应用定理 2.1 进行设定检验之前, 我们首先需要估计未知的尺度参数 a. 注意到 σ2 ∞ = limT→∞ σ2 T , 这里 σ2 T = Var 1 √ T T t=1 Vt = 1 T T s=1 T t=1 Cov(Vs, Vt) = Var(V1) + 2 T T −1 j=1 (T − j)Cov(V1, V1+j ), (2.6) 最后一个等式是基于序列 Vt 的平稳性. 在实际中我们可以用 (2.6) 式的前 r 项的相应的样 本版本去近似的估计 σ2 T , 为此我们定义 σˆ2 r,T = 1 T T t=1 (Vˆt − V¯ ) 2 + 2 T r j=1 T −j t=1 (Vˆt − V¯ )(Vˆt+j − V¯ ), 这里 V¯ = T t=1 Vˆt/T . 但是为了保证我们有足够的数据去估计相应的协方差, r 不能取得 太大. 在后面的模拟研究中, 我们发现上述估计量对 r 的选择是相当不敏感的. 当然我们也 可以用别的方法去估计 σ2 ∞ , 但是相应的估计的相合性需要作进一步的研究. 现在我们定义 aˆ = ˆσ2 r,T /(T −1 T t=1 Vˆ 2 t ), 那么如果 |aˆ−1ρ (1) T | > χ2 1(α), 我们就拒绝零假设. 376
中国科学A辑:数学第39卷第3期 2.2基于经验似然方法的非嵌套检验 现在我们将问题转向不同的VaR估计模型的比较上.假定给出两个VaR估计模型 VaR,()和VaR,(0),那么矩的条件可以重新写成:f(,)=(I{r,≤VaR,()}-p)k(a-1,24-2 .),g(zt,)=(I{r≤VaR:(0)}-p)k(-1,t-2,).注意到VaR模型评估的特殊性,传统 的非嵌套检验在这里就不能够使用。这一节里,我们将利用经验似然方法研究这个问题首 先我们定义 M(mmn()mmi Efexp( N(",)=max min N(0,)max min Efexp('g(,)]. 那么在零假设成立的条件下,两个估计模型应该具有同样的KLC距离,也就是M(,Y)= N(0,X).相应的样本的KLIC距离定义为 ,学中保=学中宁泛即 2.7) ,6,)=n咖a刘=x咖宁】 exp(X'g(:.0)). (2.8) 关于KLIC距离的差,Christoffersen等证明了下列性质, VT(Mr(ar,)-Nr(r,r》一N(0,a2),依分布 (2.9) 这里 店=(2epar》-a四川 (2.10) 下面我们构造经验似然比检验来比较两个VR估计模型的差异.设 W:=expfy"f(.B)}-exp(g(.0)). W:exp(if(,Br)}-exp(rg(t,0r)}, 在零假设成立的条件下,我们有EW:=0.类似于前面构造设定检验的方法,我们有下面的 定理,定理的证明见附录 定理2.2在Christoffersen等2到的假设条件1-g下.如果零假设M(g,Y)= N(*,X)成立,我们有 p-2∑1og1+m,)一bx,依分布. 这里b=/E形2,入由下式确定 合+=0 等价地有 b2-一x子依分布 类似于定理21 当我们实际使用定理2.2时,我们需要估计未知的刻度参数6,这可以用与 设定检验里相类似的方法来处理,具体的细节在这里就省略了. 377
中国科学 A 辑: 数学 第 39 卷 第 3 期 2.2 基于经验似然方法的非嵌套检验 现在我们将问题转向不同的 VaR 估计模型的比较上. 假定给出两个 VaR 估计模型 VaRt(β) 和 VaRt(θ), 那么矩的条件可以重新写成: f(xt, β)=(I{rt VaRt(β)}−p)k(zt−1, zt−2, ...), g(xt, θ)=(I{rt VaRt(θ)} − p)k(zt−1, zt−2,...). 注意到 VaR 模型评估的特殊性, 传统 的非嵌套检验在这里就不能够使用. 这一节里, 我们将利用经验似然方法研究这个问题. 首 先我们定义 M(β∗, γ∗) = max β min γ M(β, γ) = max β min γ E[exp (γ f(xt, β))], N(θ∗, λ∗) = maxθ min λ N(θ, λ) = maxθ min λ E[exp (λ g(xt, θ))]. 那么在零假设成立的条件下, 两个估计模型应该具有同样的 KLIC 距离, 也就是 M(β∗, γ∗) = N(θ∗, λ∗). 相应的样本的 KLIC 距离定义为 MT (βˆT , γˆT ) = max β min γ MT (β, γ) = max β min γ 1 T T t=1 exp (γ f(xt, β)), (2.7) NT (ˆθT , λˆT ) = maxθ min λ NT (θ, λ) = maxθ min λ 1 T T t=1 exp (λ g(xt, θ)). (2.8) 关于 KLIC 距离的差, Christoffersen 等 [21] 证明了下列性质, √ T(MT (βˆT , γˆT ) − NT (ˆθT , λˆT )) → N(0, σ2 ∞), 依分布. (2.9) 这里 σ2 ∞ = lim T→∞ Var 1 √ T T t=1 [exp(γ∗ f(xt, β∗)) − exp(λ∗ g(xt, θ∗))] . (2.10) 下面我们构造经验似然比检验来比较两个 VaR 估计模型的差异. 设 Wt = exp{γ∗ f(xt, β∗)} − exp{λ∗ g(xt, θ∗)}, Wˆ t = exp{γˆ T f(xt, βˆT )} − exp{λˆ T g(xt, ˆθT )}, 在零假设成立的条件下, 我们有 EWt = 0. 类似于前面构造设定检验的方法, 我们有下面的 定理, 定理的证明见附录. 定理 2.2 在 Christoffersen 等 [21] 的假设条件 1–9 下. 如果零假设 M(β∗, γ∗) = N(θ∗, λ∗) 成立, 我们有 ρ(2) T = 2 T t=1 log(1 + λWˆ t) −→ bχ2 1, 依分布. 这里 b = σ2 ∞/EW1 2, λ 由下式确定: T t=1 Wˆ t 1 + λWˆ t = 0. 等价地有 b−1ρ (2) T −→ χ2 1, 依分布. 类似于定理 2.1, 当我们实际使用定理 2.2 时, 我们需要估计未知的刻度参数 b, 这可以用与 设定检验里相类似的方法来处理, 具体的细节在这里就省略了. 377
魏正红等:基于经验似然的Value-at-Risk模型的评价方法 3模拟和实证分析 3.1随机模 在这一节,我们用随机模拟的方法来评估本文提出的经验似然比检验的功效.模拟数据 来源于GARCH1,1)模型, 2=0.1r2-1+0.85o2-1 这里©:是独立同分布的N(0,1)随机变量.所有报告的结果都是基于B=500次重复试验 即500次模拟.每次试验产生50O0个来源于GARCH(1,1)模型的观察值.为了消除初始值 对结果的影响,我们删掉了初始的2000个观测值.剩下的3000个观测值中,2000个用于 估计模型参数.1000个用于验证VaR模型.我们利用四个波动率的一阶滞后作为工具变量 在所有的模拟中,显著性水平都是10%, 四个波动率模型分别是:历史模拟法(History Simulation),RiskMetrics,.GARCH(1,1)和 GJR(1,1).下面是这四个模型的简单介绍. 1.GARCH1,1)模型: rg=可E,. a-co+ar21+3a2-1 这里:是均值为0方差为1的独立随机变量序列,0>0,a≥0,B≥0,a+30时,我们就说存在杠杆 效应 4.历史模拟法 历史模拟法是最简单最直观的计算波动率的方法,即用+时刻之前的若干观察值的标准 差作为t时刻的标准差.我们的模拟用t时刻之前的500个观察值的标准差作为t时刻的 波动预测 3.1.1设定检验的比较 关干设定检验的模拟结果见表1,表中的数据分别是用新讲方法和经验然方法得的 检验的功效.从表1中我们可以得到下列的一些结论.由于样本数据来源于GARCH(1,1)模 型,因此在下面的功效比较中我们将不考虑这个模型。 1.从表1中我们可以看到,经验似然方法比渐进方法更有效.在某些情形下,经验似然 方法的功效比渐进方法大几倍,如GJR(1,1)模型 2.在所有的波动率估计方法中,历史模拟法是最粗糙的,因此,毫不意外的,这两种方法 在识别这种错误的波动估计模型时都显得非常有效.当然,相比之下,经验似然方法还是略 好于渐进方法。 3.另一方面,从表1中可以看出,这两种方法识别RiskMetrics和GJR(1,1)模型的功效 要小于识别历史模拟法的功效,这是因为RiskMetrics和GJR(L,1)模型和GARCH属于同 类模型,而我们的数据来源于GARCH,因此要成功识别它们就显得更加困难 378
魏正红等: 基于经验似然的 Value-at-Risk 模型的评价方法 3 模拟和实证分析 3.1 随机模拟 在这一节, 我们用随机模拟的方法来评估本文提出的经验似然比检验的功效. 模拟数据 来源于 GARCH(1,1) 模型, rt = σtεt, σ2 t = 0.1r2 t−1 + 0.85σ2 t−1, 这里 εt 是独立同分布的 N(0, 1) 随机变量. 所有报告的结果都是基于 B = 500 次重复试验, 即 500 次模拟. 每次试验产生 5 000 个来源于 GARCH(1,1) 模型的观察值. 为了消除初始值 对结果的影响, 我们删掉了初始的 2 000 个观测值. 剩下的 3 000 个观测值中, 2 000 个用于 估计模型参数, 1 000 个用于验证 VaR 模型. 我们利用四个波动率的一阶滞后作为工具变量. 在所有的模拟中, 显著性水平都是 10%. 四个波动率模型分别是: 历史模拟法 (History Simulation), RiskMetrics, GARCH(1, 1) 和 GJR(1, 1). 下面是这四个模型的简单介绍. 1. GARCH(1, 1) 模型 [8]: rt = σtεt, σ2 t = c0 + αr2 t−1 + βσ2 t−1, 这里 εt 是均值为 0 方差为 1 的独立随机变量序列, c0 > 0, α 0, β 0, α + β 0 时, 我们就说存在杠杆 效应. 4. 历史模拟法: 历史模拟法是最简单最直观的计算波动率的方法, 即用 t 时刻之前的若干观察值的标准 差作为 t 时刻的标准差. 我们的模拟用 t 时刻之前的 500 个观察值的标准差作为 t 时刻的 波动预测. 3.1.1 设定检验的比较 关于设定检验的模拟结果见表1, 表中的数据分别是用渐进方法和经验似然方法得到的 检验的功效. 从表 1 中我们可以得到下列的一些结论. 由于样本数据来源于 GARCH(1, 1) 模 型, 因此在下面的功效比较中我们将不考虑这个模型. 1. 从表 1 中我们可以看到, 经验似然方法比渐进方法更有效. 在某些情形下, 经验似然 方法的功效比渐进方法大几倍, 如 GJR(1,1) 模型. 2. 在所有的波动率估计方法中, 历史模拟法是最粗糙的, 因此, 毫不意外的, 这两种方法 在识别这种错误的波动估计模型时都显得非常有效. 当然, 相比之下, 经验似然方法还是略 好于渐进方法. 3. 另一方面, 从表 1 中可以看出, 这两种方法识别 RiskMetrics 和 GJR(1,1) 模型的功效 要小于识别历史模拟法的功效, 这是因为 RiskMetrics 和 GJR(1,1) 模型和 GARCH 属于同 类模型, 而我们的数据来源于 GARCH, 因此要成功识别它们就显得更加困难. 378
中国科学A辑:数学第39卷第3期 3.1.2非嵌套检验的比较 表2是关于非嵌套检验的模拟结果.表中的数据分别是用渐进方法和经验似然方法检验 时的拒绝率,从表2中我们可以得到下面的一些结论 1.渐进方法在区别GARCH(1,1)模型和历史模拟法时有很高的拒绝率,然而在进行其它 比较时,其拒绝率都是很低的,这表明渐进方法不能够有效的区别RiskMetric,GJR(,)和 历史模拟法.然而当用经验似然方法分别来比较GARCH(1,1)和RiskMetrics,GARCH(I,1) 和GJR(1.1).RiskMetrics和GJR(1.1)时.拒绝率都是非常低的.这表明GARCH(1.1).Risk Metrics和GJR(L,1)这三种模型是一个等价类.表2的结果进一步说明了这三个模型明显区 别于历史模拟法.因此用经验似然方法我们可以将这四个模型分成两类(GARCH1,1),Rsk Metrics.GJR(1.1)}和历史模以法. 表1渐进方法(Asymp)和经验似然方法(E.L.)在设定检验中的功效比较 001 =0.05 0.10 P0.25 历史模拟法 Asymp 0.95 0.99 0974 0.874 E.L. 0.986 0.934 0.90 0.996 0.082 RiskMetrics 066 0554 0.314 E.L. 0.888 0.878 0.836 0708 GJR(11) Asymp 0.24 0.112 0.114 0.08 0.078 E.L. 0.514 0.426 0.426 0.416 0.418 2.既然RiskMetrics和GJR(L,)同属于GARCH类模型,我们自然希望它们彼此的表 现相似,但不同于历史模拟法.从这个观点来看,上面的结论表明在对模型进行分类时经验 似然法要比渐进方法优越, 3.Nelsen证明过一个结论,即如果真实的数据来源于某一个扩散过程,比如GARC阳 (L,1),则所有的GARCH类模型都可以给出相合的波动率估计.从这个观点来看,由结论1表 明经验似然方法要比渐进方法更稳健,因为前者不会因为模型的错误设定而受太大的影响 4.综上所述,经验似然方法要比通常的渐进方法有效和稳健 表2渐进方法(Asymp)和经验似然方法(E.L.)在非嵌套检验中的功效比较 VaR p=001p=0.05p=0.10 0-0.15 0=0.25 0.058 0.000 0.000 0.002 0.000 E.L. 024 012 0.166 013 0.07 GARCH(1.l)vsRiskMetrics Asymp 0.07 0.290 0.288 0.19n 0.030 E.L. 0.256 0.132 0.174 0.156 0.068 Asymp 0.008 0.000 0.00 0.00 0.000 o.x 0.00 0.0 历史模拟法vs RiskMetrics Asymp 0.07 0.00 0.00 0.02 0.00 E.L. 0.530 0.572 0.536 0.56 0.374 历史模拟法vs GJR(1.1) Asymp 0.050 0.02 0.000 0.002 000 E.L 0.672 0g0 0.792 0.566 GARCH(L,)s历史模拟法 Asymp 0.78 0.916 0.918 070 E.L. 0.660 0.806 0.812 0.796 0.574
中国科学 A 辑: 数学 第 39 卷 第 3 期 3.1.2 非嵌套检验的比较 表 2 是关于非嵌套检验的模拟结果. 表中的数据分别是用渐进方法和经验似然方法检验 时的拒绝率, 从表 2 中我们可以得到下面的一些结论. 1. 渐进方法在区别 GARCH(1,1) 模型和历史模拟法时有很高的拒绝率, 然而在进行其它 比较时, 其拒绝率都是很低的, 这表明渐进方法不能够有效的区别 RiskMetrics, GJR(1,1) 和 历史模拟法. 然而当用经验似然方法分别来比较 GARCH(1,1) 和 RiskMetrics, GARCH(1,1) 和 GJR(1,1), RiskMetrics 和 GJR(1,1) 时, 拒绝率都是非常低的, 这表明 GARCH(1,1), RiskMetrics 和 GJR(1,1) 这三种模型是一个等价类. 表 2 的结果进一步说明了这三个模型明显区 别于历史模拟法. 因此用经验似然方法我们可以将这四个模型分成两类 {GARCH(1,1), Risk Metrics, GJR(1,1)}和历史模拟法. 表 1 渐进方法 (Asymp) 和经验似然方法 (E. L.) 在设定检验中的功效比较 p=0.01 p=0.05 p=0.10 p=0.15 p=0.25 历史模拟法 Asymp 0.956 0.990 0.988 0.974 0.874 E. L. 0.986 0.994 0.994 0.996 0.982 RiskMetrics Asymp 0.588 0.636 0.636 0.554 0.314 E. L. 0.828 0.888 0.878 0.836 0.708 GJR(1,1) Asymp 0.246 0.112 0.114 0.086 0.078 E. L. 0.544 0.426 0.426 0.416 0.418 2. 既然 RiskMetrics 和 GJR(1,1) 同属于 GARCH 类模型, 我们自然希望它们彼此的表 现相似, 但不同于历史模拟法. 从这个观点来看, 上面的结论表明在对模型进行分类时经验 似然法要比渐进方法优越. 3. Nelsen[33] 证明过一个结论, 即如果真实的数据来源于某一个扩散过程, 比如 GARCH (1,1), 则所有的 GARCH 类模型都可以给出相合的波动率估计. 从这个观点来看, 由结论1表 明经验似然方法要比渐进方法更稳健, 因为前者不会因为模型的错误设定而受太大的影响. 4. 综上所述, 经验似然方法要比通常的渐进方法有效和稳健. 表 2 渐进方法 (Asymp) 和经验似然方法 (E. L.) 在非嵌套检验中的功效比较 VaR p=0.01 p=0.05 p=0.10 p=0.15 p=0.25 RiskMetrics vs GJR(1,1) Asymp 0.058 0.000 0.000 0.002 0.000 E. L. 0.246 0.128 0.156 0.136 0.070 GARCH(1,1) vs RiskMetrics Asymp 0.072 0.290 0.288 0.190 0.036 E. L. 0.256 0.132 0.174 0.156 0.068 GARCH(1,1) vs GJR(1,1) Asymp 0.008 0.000 0.000 0.000 0.000 E. L. 0.038 0.006 0.004 0.002 0.002 历史模拟法 vs RiskMetrics Asymp 0.076 0.004 0.008 0.002 0.002 E. L. 0.536 0.572 0.596 0.560 0.374 历史模拟法 vs GJR(1,1) Asymp 0.050 0.002 0.000 0.002 0.000 E. L. 0.672 0.798 0.830 0.792 0.566 GARCH(1,1) vs 历史模拟法 Asymp 0.784 0.916 0.918 0.896 0.708 E. L. 0.660 0.806 0.842 0.796 0.574 379
魏正红等:基于经验似然的Value-at-Risk模型的评价方法 3.2实证分析 在这一节中,我们将利用中国股票市场的实际数据,分别对渐进方法和似然方法的检验 结果作比较.我们选取的是上证指数,时间从1990年12月19日到2005年4月1日,数 来源于深圳证券交易所的交易数据库.由于深圳主版市场自000年以来停止发行新股,所 以深证指数基本不能反映大盘的走热因出我们没有考虑注意到日收荟定义为 r4=ln(S.)-ln(S.1). 这里S:是上证指数的t日收盘价.计算结果列在表36中.表中的数据是检验统计量的值 我们同时考虑5%和1%的检验水平.不同水平的临界值(CV)也在表中给出.我们用“*” 表示“在1%水平下不拒绝”,用“*”表示在1%和5%水平下都不拒绝” 对于设定检验,根据表3和表4我们得到下列结论: 1.首先我们看1%显著水平下的结果.当p=0.01时,除了历史模拟法和RiskMetrics 模型之外,其它所有模型都没有被拒绝.当p≠0.01时.两种检验方法都拒绝所有的模型.这 与Christoffersen等(见文献2l)所得到的结论是一致的.即设定检验不容易拒绝极端Va 估计,如p=0.01,易拒绝低分位数VaR,如p=0.25,0.15等 2.在5%的检验水平下.结果和1%的水平类似.只右一点区别.那就是Risk1M©tics模 型,如果采用渐进方法则不被拒绝,而用经验似然方法则被拒绝 表3基于渐进方法的设定检验 VaR 0=0.01 00.05 D=010 n=015 D025 历史模拟法 19.5506 284326 451047 59.3348 50.3273 9.6797 22.7542 14.2153 21.490 19.967 GARCH(1) 3.6747* 28.9094 13.5687 17.3633 23.4247 GIR01) 10)48*卡 14783R 116474 14.3736 20.2767 (当显者水平为5%时,CV=7.81:当显若水平为1%时,CV=1134) 表4基于经验似然方法的设定检验 VaR p=0.0 p=0.10 p-0.15 p=0.25 历史模拟法 24.5751 25.9190 37.0130 48.6278 44.1488 10 6660 23.7479 12.0050 18.0005 1只5827 GARCH(1.1) 4.1666* 25.9527 11.9767 15.3586 21.4619 JR(1, 1.6727 4.360 10.1250 12.8433 18.7422 当显著水平为%时,CV三384当显者水平为1%时,CV=66) 关于非嵌套检验的结果,由表5和表6给出.从这两个表中的数据,我们可以得出下面 一些结论:当=0.05时,四个波动模型用两种检验方法检验,在统计意义上都是不显著的 当p=0.10,0.15,0.25时,GARCH(1,1),RiskMetrics和GJR(1,1)这三个波动模型在两种检 验方法下都是不显著的,而历史模拟法与这三个模型的区别是显著的:当p=0.01时,结论 则比较复杂。 4附录 本节给出定理2.2的证明,定理2.1的证明可类似得出.首先看两个引理 380
魏正红等: 基于经验似然的 Value-at-Risk 模型的评价方法 3.2 实证分析 在这一节中, 我们将利用中国股票市场的实际数据, 分别对渐进方法和似然方法的检验 结果作比较. 我们选取的是上证指数, 时间从 1990 年 12 月 19 日到 2005 年 4 月 1 日, 数据 来源于深圳证券交易所的交易数据库. 由于深圳主版市场自 2000 年以来停止发行新股, 所 以深证指数基本不能反映大盘的走势, 因此我们没有考虑. 注意到, 日收益定义为 rt = ln(St) − ln(St−1), 这里 St 是上证指数的 t 日收盘价. 计算结果列在表 3–6 中. 表中的数据是检验统计量的值. 我们同时考虑 5% 和 1% 的检验水平. 不同水平的临界值 (CV) 也在表中给出. 我们用 “∗” 表示 “在 1% 水平下不拒绝”, 用 “∗∗” 表示 “在 1% 和 5% 水平下都不拒绝”. 对于设定检验, 根据表 3 和表 4 我们得到下列结论: 1. 首先我们看 1% 显著水平下的结果. 当 p = 0.01 时, 除了历史模拟法和 RiskMetrics 模型之外, 其它所有模型都没有被拒绝. 当 p = 0.01 时, 两种检验方法都拒绝所有的模型. 这 与 Christoffersen 等 (见文献 [21]) 所得到的结论是一致的. 即设定检验不容易拒绝极端 VaR 估计, 如 p=0.01, 易拒绝低分位数 VaR, 如 p=0.25, 0.15 等. 2. 在 5% 的检验水平下, 结果和 1% 的水平类似. 只有一点区别, 那就是 RiskMetrics 模 型, 如果采用渐进方法则不被拒绝, 而用经验似然方法则被拒绝. 表 3 基于渐进方法的设定检验 VaR p=0.01 p=0.05 p=0.10 p=0.15 p=0.25 历史模拟法 19.5506 28.4326 45.1047 59.3348 50.3273 RiskMetrics 9.6797* 22.7542 14.2153 21.4903 19.9675 GARCH(1,1) 3.8747** 28.9094 13.5687 17.3633 23.4247 GJR(1,1) 1.9248** 14.7838 11.6474 14.3736 20.2767 (当显著水平为 5% 时, CV = 7.81; 当显著水平为 1% 时, CV = 11.34) 表 4 基于经验似然方法的设定检验 VaR p=0.01 p=0.05 p=0.10 p=0.15 p=0.25 历史模拟法 24.5751 25.9190 37.0130 48.6278 44.1488 RiskMetrics 10.6660 23.7472 12.0050 18.0905 18.5827 GARCH(1,1) 4.1666** 25.9527 11.9767 15.3586 21.4619 GJR(1,1) 1.6727** 14.3605 10.1250 12.8433 18.7422 (当显著水平为 5% 时, CV = 3.84; 当显著水平为 1% 时, CV = 6.63) 关于非嵌套检验的结果, 由表 5 和表 6 给出. 从这两个表中的数据, 我们可以得出下面 一些结论: 当 p = 0.05 时, 四个波动模型用两种检验方法检验, 在统计意义上都是不显著的; 当 p = 0.10, 0.15, 0.25 时, GARCH(1,1), RiskMetrics 和 GJR(1,1) 这三个波动模型在两种检 验方法下都是不显著的, 而历史模拟法与这三个模型的区别是显著的; 当 p = 0.01 时, 结论 则比较复杂. 4 附录 本节给出定理 2.2 的证明, 定理 2.1 的证明可类似得出. 首先看两个引理. 380
中国科学A辑:数学第39卷第3期 引理4.1在定理2.2的条件下,我们有 (c)Zr :maxicterlWl=o(T)a.s. d)=op() 证明(a)可以由文献21得出. 表5基于渐进方法的非嵌套检验 VaR =0.01 p=0,10 P=0.15 p=0.25 历史模拟法s RiskMetrics -1.7266* -0.6161* -3.7731 -3.7134 -3.2499 历中模拟法GARCH11) -41781 00428* -3g88 -4.6739 -2360 历史模拟法sGJR(1,1) -5.9080 -17774* -4.5301 -5.5301 -3.1765 -1510 051 -0.0824* -0.4639* 0.3413 RiskMetrics vs GJR(1.1) -2.6058 -1.0394* 0.3504* -0.8836* 0.0329* GARCH(1.1)vs GJR(1.1) 0.6561** -18983** -0.2622** 0.3716** 0.3350* (当显著水平为%时,CV=1.96:当显者水平为1%时,CV=2.58) 表6基于经验似然方法的非嵌套检验 VaR p=0.01 p=0.05 =0.10 p=0,15 p=0.25 历史模拟法sRiskMetrics 16567** 0.2486** 3.9777+ 5.1641* 6.4872* 历史模拟法s GARCHO1,1) 4.6358 0.0014** 5.1185 6.8435 6.R506 历史模拟法sGR(1, 5.6294 1,2511 5.1548 7.447 7.819 RiskMetrics vs GARCH(1,1) 2.2793 0,4039* 0.0121* 0.6602* 0.3472 RiskMetrics ys GIR(11) 2.1566** 2.3947* 0.2439** 1.8763** 0.0027** GARCHILI)YS GIROLI) 0.7857* 3.0060** 11641** 3.2636* 20415* (当显者水平为5%,CV=3.84:当显著水平为1%,CV=6.63) (b)根据文献21附录中的结论,我们有√T(ar-)=O(1),√T(5r-Y)=O1). VT(r-)=O(1),和VT(r-)=O,().最后根据Taylor展开式和大数定律就可以 得到b). (C)因为对任意的t≥1,有Ei?<ox,由著名的不等式∑eP1≥n)≤E≤ 1+∑-1P(≥n,有∑产-1P(i≥T)<o.根据Borel--Cantell写引理,P(limsupr{i? T)=P(2≥T,i.o.)=0,即,仅有有限多的T使得,对所有的1≤t≤T,≥T,as,由 此可以推得,仅有有限多的T使得 所以,limsupT Zr/厅≤1a.5,现在我们得到,对任意的整数m≥1及t≥1,E(m成)P<o 成立,类似的推理可以证明。 ip≤示,对所有的m≥1 一r({m系≤》)=1 381
中国科学 A 辑: 数学 第 39 卷 第 3 期 引理 4.1 在定理 2.2 的条件下, 我们有 (a) √ 1 T T t=1 Wˆ t = √ 1 T T t=1 Wt + op(1) → N(0, σ2 ∞). (b) 1 T T t=1 Wˆ 2 t → EW1 2, 依概率. (c) ZT := max1tT |Wˆ t| = o(T 1 2 ) a.s. (d) λ = Op( √ 1 T ). 证明 (a) 可以由文献 [21] 得出. 表 5 基于渐进方法的非嵌套检验 VaR p=0.01 p=0.05 p=0.10 p=0.15 p=0.25 历史模拟法 vs RiskMetrics –1.7266** –0.6161** –3.7731 –3.7134 –3.2499 历史模拟法 vs GARCH(1,1) –4.1781 0.0428** –3.9885 –4.6739 –2.6360 历史模拟法 vs GJR(1,1) –5.9080 –1.7774** –4.5301 –5.5301 –3.1765 RiskMetrics vs GARCH(1,1) –1.5510** 0.5531** –0.0824** –0.4639** 0.3413** RiskMetrics vs GJR(1,1) –2.6058 –1.0394** –0.3504** –0.8836** 0.0329** GARCH(1,1) vs GJR(1,1) –0.6561** –1.8393** –0.2622** –0.3716** –0.3350** (当显著水平为 5% 时, CV = 1.96; 当显著水平为 1% 时, CV = 2.58) 表 6 基于经验似然方法的非嵌套检验 VaR p=0.01 p=0.05 p=0.10 p=0.15 p=0.25 历史模拟法 vs RiskMetrics 1.6567** 0.2486** 3.9777* 5.1641* 6.4872* 历史模拟法 vs GARCH(1,1) 4.6358* 0.0014** 5.1185* 6.8435 6.8506 历史模拟法 vs GJR(1,1) 5.6294* 1.2511** 5.1548* 7.4473 7.8196 RiskMetrics vs GARCH(1,1) 2.2793** 0.4039** 0.0121** 0.6602** 0.3472** RiskMetrics vs GJR(1,1) 2.1566** 2.3947** 0.2439** 1.8763** 0.0027** GARCH(1,1) vs GJR(1,1) 0.7857** 3.0060** 1.1641** 3.2636** 2.0415** (当显著水平为 5%, CV = 3.84; 当显著水平为 1%, CV = 6.63) (b) 根据文献 [21] 附录中的结论, 我们有 √ T(βˆT − β∗) = Op(1), √ T(ˆγT − γ∗) = Op(1), √ T(ˆθT − θ∗) = Op(1), 和 √ T(λˆT − λ∗) = Op(1). 最后根据 Taylor 展开式和大数定律就可以 得到 (b). (c) 因为对任意的 t 1, 有 EWˆ 2 t < ∞ , 由著名的不等式 ∞ n=1 P(|ξ| n) E|ξ| 1 +∞ n=1 P(|ξ| n), 有 ∞ T =1 P(Wˆ 2 t T ) < ∞. 根据 Borel-Cantelli 引理, P(lim supT {Wˆ 2 t T }) = P(Wˆ 2 t T, i.o.) = 0, 即, 仅有有限多的 T 使得, 对所有的 1 t T, Wˆ 2 t T, a.s., 由 此可以推得, 仅有有限多的 T 使得 max 1tT Wˆ 2 t T a.s. ⇐⇒ ZT √ T 1 a.s., 所以, lim supT ZT / √ T 1 a.s., 现在我们得到, 对任意的整数 m 1 及 t 1, E(mWˆ t)2 < ∞ 成立, 类似的推理可以证明, lim sup T ZT √ T 1 m a.s., 对所有的 m 1 ⇐⇒ P ∞ m=1 lim sup T ZT √ T 1 m = 1, 381
魏正红等:基于经验似然的Value-at-Risk模型的评价方法 一P(mp系-0)-1一z=而a (d)注意到 0=22成-江 因此,我们有 2叫-2网2好 AN 所以 +W)≥宁三好 那么我们可以导出 2T, W≤w暖-1宁2Wm网 根据引理的(a)-(),我们有 =() 会明 要=o(T 因此,入=0(1/WT) 引理4.2在定理4.2的条件下,有∑1m,=∑1(Am,)2+0(1) 证明根据Taylor展式,我们可以得到 台1+ -A1-m,+0(am,)2) -2ai-2ataP+o(么时) 注意到A3∑T1引≤A3max1≤≤Tm∑T12=O(T-3/2)o(T±)O(T)=o().因此 有∑1AW .(2+op() 定理2.2的证明由引理4.2,我们有∑,成=A∑,+o(公-1),所以, 票+((会时))一+ooaa》 因此,我们有 9-空+i -2i-2P+2oat=宫成i+o +一()小依分布 T-1∑1W 382
魏正红等: 基于经验似然的 Value-at-Risk 模型的评价方法 ⇐⇒ P lim sup T ZT √ T = 0 = 1 ⇐⇒ ZT = o( √ T) a.s. (d) 注意到 0 = 1 T T t=1 Wˆ t 1 + λWˆ t = 1 T T t=1 Wˆ t − λ T T t=1 Wˆ 2 t 1 + λWˆ t . 因此, 我们有 1 T T t=1 Wˆ t = |λ| T T t=1 Wˆ 2 t 1 + λWˆ t |λ| 1 + |λ| maxt |Wˆ t| 1 T T t=1 Wˆ 2 t , 所以, 1 T T t=1 Wˆ t 1 + |λ| maxt |Wˆ t| |λ| 1 T T t=1 Wˆ 2 t . 那么我们可以导出 |λ| | 1 T T t=1 Wˆ t| 1 T T t=1 Wˆ 2 t − | 1 T T t=1 Wˆ t| maxt |Wˆ t| . 根据引理的 (a)–(c) , 我们有 1 T T t=1 Wˆ t = Op 1 √ T , 1 T T t=1 Wˆ 2 t →σ2 ∞, max 1tT |Wˆ t| = op(T 1 2 ). 因此, λ = Op(1/ √ T). 引理 4.2 在定理 4.2 的条件下, 有 T t=1 λWˆ t = T t=1(λWˆ t)2 + op(1). 证明 根据 Taylor 展式, 我们可以得到 0 = λ T t=1 Wˆ t 1 + λWˆ t = λ T t=1 Wˆ t(1 − λWˆ t + Op((λWˆ t) 2)), = T t=1 (λWˆ t) − T t=1 (λWˆ t) 2 + λ3Op T t=1 Wˆ 3 t . 注意到 λ3| T t=1 Wˆ 3 t | λ3 max1tT |Wˆ t| T t=1 Wˆ 2 t = Op(T −3/2)op(T 1 2 )Op(T ) = op(1). 因此 有 T t=1 λWˆ t = T t=1(λWˆ t)2 + op(1). 定理 2.2 的证明 由引理 4.2 , 我们有 T t=1 Wˆ t = λT t=1 Wˆ 2 t + op(λ−1). 所以, λ = T t=1 Wˆ t T t=1 Wˆ 2 t + op λ−1 T t=1 Wˆ 2 t −1 = T t=1 Wˆ t T t=1 Wˆ 2 t + op(Op(T 1 2 )Op(T −1)) = T t=1 Wˆ t T t=1 Wˆ 2 t + op 1 √ T . 因此, 我们有 ρ(2) T = 2 T t=1 log(1 + λWˆ t) = 2 T t=1 λWˆ t − T t=1 (λWˆ t) 2 + 2 T t=1 op((λWˆ t) 2) = λ T t=1 Wˆ t + op(1) = (T −1/2 T t=1 Wˆ t)2 T −1 T t=1 Wˆ 2 t + op(1) −→ σ2 ∞ EWt 2 χ2 1, 依分布. 382