极值理论检验 如何准确刻画投资中的极值事件,度量金融业所面临的极值风险,一直是投资者以及金 融监管者关注的问题。一系列金融危机事件的发生催生了极值理论( Extreme Value Theory, EⅥT)在投资风险管理中的应用:1995年2月,世纪著名商业银行巴林银行其新加坡分行一 名交易员 Nick leeson的交易就成了将近九亿美元的损失;几个月后,日本大和银行发现 交易员 Toshihide Iguchi造成了七亿美元的亏损。这类事件的连续发生促使美联储主席 Alan Greenspan建议在金融风险领域运用极值理论(EVT) 事实上,极值理论的不断深化和发展为度量极值风险提供了一个有效的工具。在利用极 值理论进行风险管理时,首先必须对极值事件的统计规律进行分析,得出极值分布中各个参 数的估计。因此,本节先简要介绍一下极值理论的基本概念和估计方法,然后基于实际案例 介绍极值理论在VaR中的应用。 极值理论简介 个随机过程的极值指的是在给定的时间区间上的极大极小值。极值方法注重价格或回 报分布的尾部而不是整个分布。 若用表示某资产的日收益率,则该资产n天中的收益率集合可表示为{2…,rn}。 该集合中的最小收益率(也即最小次序统计量)为1= min sisn},最大收益率(也即最 大次序统计量)为rm1=maxs}因此对于持有该头寸的多头而言,其所持头寸的vaR 与r是密切相关的;对于持有该头寸的空头而言,其所持头寸的VaR则与rn密切相关 实际上两者之间的关系只需通过一个简单的符号变换即可得到 (1=- maxI}=-m),本文主要讨论rm的性质,并通过以上转换来计算多头头 寸的VaR 假设收益率r是独立的时间序列,且r的变化范围为[,累积概率密度分布函数为 F(x),则rn的累积概率密度分布函数Fn(x)可由式(1)给出 Fn(x)=Ptn≤=Pt≤x…n≤x=IImP(≤x)={(x)() 极值理论关心的是找到两个序列{}和{an},使得rm=(rm)-Bn)/an当n趋于无穷
1 极值理论检验 如何准确刻画投资中的极值事件,度量金融业所面临的极值风险,一直是投资者以及金 融监管者关注的问题。一系列金融危机事件的发生催生了极值理论(Extreme Value Theory, EVT)在投资风险管理中的应用:1995 年 2 月,世纪著名商业银行巴林银行其新加坡分行一 名交易员 Nick Leeson 的交易就成了将近九亿美元的损失;几个月后,日本大和银行发现 一交易员 Toshihide Iguchi 造成了七亿美元的亏损。这类事件的连续发生促使美联储主席 Alan Greenspan 建议在金融风险领域运用极值理论(EVT)。 事实上,极值理论的不断深化和发展为度量极值风险提供了一个有效的工具。在利用极 值理论进行风险管理时,首先必须对极值事件的统计规律进行分析,得出极值分布中各个参 数的估计。因此,本节先简要介绍一下极值理论的基本概念和估计方法,然后基于实际案例 介绍极值理论在 VaR 中的应用。 一、极值理论简介 一个随机过程的极值指的是在给定的时间区间上的极大极小值。极值方法注重价格或回 报分布的尾部而不是整个分布。 若用 t r 表示某资产的日收益率,则该资产 n 天中的收益率集合可表示为 r1 ,,rn 。 该集合中的最小收益率(也即最小次序统计量)为 r(1) min1 jn rj,最大收益率(也即最 大次序统计量)为 r(n) max1 jn rj 。因此对于持有该头寸的多头而言,其所持头寸的 VaR 与 (1) r 是密切相关的;对于持有该头寸的空头而言,其所持头寸的 VaR 则与 (n) r 密切相关。 实际上两者之间的关系只需通过一个简单的符号变换即可得到 ( (1) max1 j n j (n) r r r ),本文主要讨论 (n) r 的性质,并通过以上转换来计算多头头 寸的 VaR。 假设收益率 t r 是独立的时间序列,且 t r 的变化范围为 l,u ,累积概率密度分布函数为 F(x),则 (n) r 的累积概率密度分布函数 ( ) , F x n n 可由式(1)给出: n n j n n n n j F x r x r x r x r x F x 1 , ( ) 1 ( ) Pr Pr , , Pr( ) ( ) (1) 极值理论关心的是找到两个序列 n 和 n ,使得 n n n n r( ) (r( ) )/ 当 n 趋于无穷
时收敛于一个非退化分布。其中序列{Bn}被称为位置序列,{an}被称为尺度因子序列。在 以上假定下,标准化的最大收益率m的极限分布为 F、()2=ep-(+9)4y5≠0 exp[-exp(-x)] if 5=0 如果0,则上式对x>、1 二成立。5被称为形 5 状参数,它控制着极限分布的尾部形状,而a=一则称为分布的尾指数。 上式是极限分布的一般形式,它包含了以下三种情形: 1.5=0, Gumbe族,其累积概率密度分布函数为 F.(x)= exp -ex-x)],-∞0,族, Frechet其累积概率密度分布函数为: F(x)=p(1+4)-]x>-1 其他情况 3.5<0, Weibull族,其累积概率密度分布函数为 F、()=ep-(+5)x<-1 其他情况 在风险管理中,我们主要对 Frechet族感兴趣,它包含了平稳分布和学生t-分布。极 值理论有两个重要的特征: 1.r的累积概率密度分布函数F(x)的尾部行为而不是具体的分布决定了最大收益率 的极限分布。基于此,对于收益率r的一个较为广泛的分布形态,极值理论都是实 际可行的 2.尾指数并不依赖与收益率r的时间间隔,也即尾指数在时间累积下是不变的,从 1参见Tsay(2010)的著作“ Analysis of Financial Time Series”,3
2 时收敛于一个非退化分布。其中序列 n 被称为位置序列, n 被称为尺度因子序列。在 以上假定下,标准化的最大收益率 (n) r 的极限分布为1: exp[ exp( )] 0 exp[ (1 ) ] 0 ( ) 1 x if x if F x (2) 如果 0 ,则上式对 1 x 成立,如果 0 ,则上式对 1 x 成立。 被称为形 状参数,它控制着极限分布的尾部形状,而 1 则称为分布的尾指数。 上式是极限分布的一般形式,它包含了以下三种情形: 1. 0,Gumbel 族,其累积概率密度分布函数为: F (x) exp exp(x) , x (3) 2. 0,族,Fréchet 其累积概率密度分布函数为: 0 其他情况 1 exp[ (1 ) ] ( ) 1 x if x F x (4) 3. 0,Weibull 族,其累积概率密度分布函数为: 1 其他情况 1 exp[ (1 ) ] ( ) 1 x if x F x (5) 在风险管理中,我们主要对 Fréchet 族感兴趣,它包含了平稳分布和学生 t-分布。极 值理论有两个重要的特征: 1. t r 的累积概率密度分布函数 F(x) 的尾部行为而不是具体的分布决定了最大收益率 的极限分布。基于此,对于收益率 t r 的一个较为广泛的分布形态,极值理论都是实 际可行的。 2. 尾指数 并不依赖与收益率 t r 的时间间隔,也即尾指数在时间累积下是不变的,从 1 参见 Tsay(2010)的著作“Analysis of Financial Time Series”, 3rd
而可以用于计算不同时间区间上的aR 以下简要讨论一下极值分布的估计方法。由前文可知,极值分布包含3个参数:5(形 状参数)、Bn(位置参数)和an(尺度参数)。对于给定的样本,只有一个单一的最大收益 率或最小收益率,而仅用一个极端观测并不能估计出三个参数,因此必须采取其他方法。在 具体估计方法的选择上,常用的有两类 第一类方法称为参数方法。该方法一个基本的想法是将样本分为g个互不交互的子样本, 且每个子样本有n个观测值,则每个子样本对应于数据区间的一个子区间。当n充分大时 我们希望极值理论对每个子样本都适用,而n的值则由实际情况来决定。这样我们可以得到 n个最大值的集合和n个最小值的集合,从而用来估计极值分布的未知参数。通常有两种参 数方法:极大似然方法和回归方法, 第二类方法称为非参数方法,直接对变量r进行尾估计,并不需要考虑子样,如Hill 估计。该方法将样本的次序统计量表示为: 令q为一个正整数,则Hi1l计的形状参数定义为 5(q)= 9q当时Hl1估计(q)是稳定的。由于本文采用R中 的软件包evir2来进行极值理论的参数估计,因此具体的计算过程不再详述。 二、极值理论在VaR中的应用 本节中我们使用万科A(00002)股票从1991年1月30日2011年12月26日的日对 数收益率数据进行极值理论分析。图10-16给出了子区间长度为21个交易日时极端日对数 收益率的时间图形。从图可知,1997年之前万科的最大涨跌幅往往超过10%,这是因为当时 中国股市还没有实施涨跌停制度3。因此,在目前的制度环境下,本节以下部分只对1997年 1月1日-2011年12月26日的日收益率数据进行分析。 2R中用于进行H估计的命令为hi,用于进行极大似然估计的命令为e,A、B股)、基金类证券的交 3上海、深圳证券交易所自1996年12月16日起,分别对上市交易的股票(含 易实行价格涨跌幅限制
3 而可以用于计算不同时间区间上的 VaR。 以下简要讨论一下极值分布的估计方法。由前文可知,极值分布包含 3 个参数: (形 状参数)、 n (位置参数)和 n (尺度参数)。对于给定的样本,只有一个单一的最大收益 率或最小收益率,而仅用一个极端观测并不能估计出三个参数,因此必须采取其他方法。在 具体估计方法的选择上,常用的有两类: 第一类方法称为参数方法。该方法一个基本的想法是将样本分为 g 个互不交互的子样本, 且每个子样本有 n 个观测值,则每个子样本对应于数据区间的一个子区间。当 n 充分大时, 我们希望极值理论对每个子样本都适用,而 n 的值则由实际情况来决定。这样我们可以得到 n 个最大值的集合和 n 个最小值的集合,从而用来估计极值分布的未知参数。通常有两种参 数方法:极大似然方法和回归方法。 第二类方法称为非参数方法,直接对变量 t r 进行尾估计,并不需要考虑子样,如 Hill 估计。该方法将样本的次序统计量表示为: (1) (2) (T ) r r r 令 q 为一个正整数,则 Hill 估计的形状参数ξ定义为: q i T i T q r r q q 1 ( 1) ( ) [ln( ) ln( )] 1 ( ) (6) 其中 (q) 说明该估计 依赖于 q 。研究表明,Hill 估计仅仅对 Fréchet 族是适用的,此 时可以找到一个合适的 q ,使得 q q 当时 Hill 估计 (q) 是稳定的。由于本文采用 R 中 的软件包 evir2来进行极值理论的参数估计,因此具体的计算过程不再详述。 二、极值理论在 VaR 中的应用 本节中我们使用万科 A(000002)股票从 1991 年 1 月 30 日-2011 年 12 月 26 日的日对 数收益率数据进行极值理论分析。图 10-16 给出了子区间长度为 21 个交易日时极端日对数 收益率的时间图形。从图可知,1997 年之前万科的最大涨跌幅往往超过 10%,这是因为当时 中国股市还没有实施涨跌停制度3。因此,在目前的制度环境下,本节以下部分只对 1997 年 1 月 1 日-2011 年 12 月 26 日的日收益率数据进行分析。 2 R 中用于进行 Hill 估计的命令为 hill,用于进行极大似然估计的命令为 gev。 3上海、深圳证券交易所自 1996 年 12 月 16 日起,分别对上市交易的股票(含 A、B 股)、基金类证券的交 易实行价格涨跌幅限制
月最小对数收益率--月最大对数收益率 图1子区间为21个交易日时,万科A极端日对数收益率变动 图2给出了Hi1估计5(q)对q的散点图。由图可知,对于最大和最小日对数收益率, 5(q)随着q的增加而不断上升,这说明Hi1l估计方法对万科A的日收益率进行极值分布估 计可能是不太合适的 Threshold 9.537005.444.594.113.643.313.042802.58 155289132180228276324372420468 Order statistics 10.405.744.644013.503.152822.52228 155289132180228276324372420468 Order Statistics 图2万科A日对数收益率H11估计散点图 (注:上图为最大收益率,下图为最小收益率) 表1则给出了对不同长度子区间基于极大似然法估计出的极值分布参数结果°。 表1万科A日对数收益率极值分布的极大似然估计 4估计结果由R软件包evir中的hl命令计算得到 3估计结果由R软件包ev中的gev命令计算得到
4 图 1 子区间为 21 个交易日时,万科 A 极端日对数收益率变动 图 2 给出了 Hill 估计 (q) 对 q 的散点图4。由图可知,对于最大和最小日对数收益率, (q) 随着 q 的增加而不断上升,这说明 Hill 估计方法对万科 A 的日收益率进行极值分布估 计可能是不太合适的。 图 2 万科 A 日对数收益率 Hill 估计散点图 (注:上图为最大收益率,下图为最小收益率) 表 1 则给出了对不同长度子区间基于极大似然法估计出的极值分布参数结果5。 表 1 万科 A 日对数收益率极值分布的极大似然估计 4 估计结果由 R 软件包 evir 中的 hill 命令计算得到。 5 估计结果由 R 软件包 evir 中的 gev 命令计算得到。 月最小对数收益率 月最大对数收益率
子区间长度 形状参数n 尺度参数an 位置参数Bn 最小收益率 1个月(n=21,g=173) 0.191(0.074)1.686(0.120)3.447(0.150) 2个月(n=42,g=87 0.135(0.1221.990.207)4.343(0.260) 最大收益率 1个月(n=21,g=173)-0.47(0.098)2.125(0.158)4.131(0.203) 2个月(n=42,g=87)-0.795(0.094)3.106(0.354)5.990.355) 注:括号内的数据位标准误差 为对以上估计结果进行检验,图3给出了子区间长度为21个交易日时最小日收益率极 值分布拟合的残差结果。由下面的QQ图可以看出,该拟合是较为合理的。 Ordered Data 图3万科A最小日对数收益率极值分布拟合的残差图 令n=(m)-Bn)/an,将表1中估计出的参数值代入式(2),则可以得到极值分布在 给定概率下的分位数。 具体计算过程如下: 若令P为该分布的上尾分布概率,则r,(意味着潜在损失,即前文定义的VaR)对应 着极限分布下某子区间极值的1-P分位数。此时有 5,(r-B)-2 {-[1 0 Bn expl-exp( J5n=0
5 子区间长度 形状参数 n 尺度参数 n 位置参数 n 最小收益率 1 个月(n=21,g=173) 0.191(0.074) 1.686(0.120) 3.447(0.150) 2 个月(n=42,g=87) 0.135(0.122) 1.999(0.207) 4.343(0.260) 最大收益率 1 个月(n=21,g=173) -0.447(0.098) 2.125(0.158) 4.131(0.203) 2 个月(n=42,g=87) -0.795(0.094) 3.106(0.354) 5.999(0.355) 注:括号内的数据位标准误差。 为对以上估计结果进行检验,图 3 给出了子区间长度为 21 个交易日时最小日收益率极 值分布拟合的残差结果。由下面的 Q-Q 图可以看出,该拟合是较为合理的。 图 3 万科 A 最小日对数收益率极值分布拟合的残差图 令 n n n n r (r( ) )/ ( ) ,将表 1 中估计出的参数值代入式(2),则可以得到极值分布在 给定概率下的分位数。 具体计算过程如下: 若令 P 为该分布的上尾分布概率,则 ( ) n r (意味着潜在损失,即前文定义的 VaR)对应 着极限分布下某子区间极值的 1- P 分位数。此时有 exp[ exp( )] 0 ] } 0 ( ) exp{ [1 1 ( ) 1 ( ) n n n n n n n n n if r if r P n (8)
整理后可得相应的分位数为 A-=(-lm-P")s}f5n≠0 B-a In[In(1-PI if 5=0 由于1-P=P(≤1n)=[PGsm),则式(10-3)变为 Bn--{1-[-nln(1-P)}5n≠0 Var= B,-an In[nIn(1-P) if 5n=0 其中n是子区间长度。以上即是基于极值理论的VaR计算公式,其计算过程可概括如下 1.选择子区间的长度n,并得到子区间的最小值tm},i=1,…,g,这里g=[T/川] 2.得到5n、an和βn的极大似然估计并检查极值模型的充分性和有效性 应用式(10-34)计算ⅤaR 以万科A股票为例,对其1997年1月1日至2011年12月26日的日对数收益率数进行 极值分布的参数估计 取n=21,从表-10可知n=0.191、an=1.686、Bn=3.447。对应的置信度为0.01的 VaR值为: 1686 R=3447-{1-[-21*ln(1-0.01)}=6 0.191 也就是说,万科A股票在1%置信水平下日对数收益率不会低于-6.50% 若取n=42,则有5n=0.135、an=1.99Bn=4.343。对应的置信度为1%的VaR值为: aR=43-9c-1(1-00013}=617 0.135 此时,万科A股票在1%置信水平下日对数收益率不会低于-6.17%。 注意到以上案例中,不同的参数n对应着不同的VaR值,而n=21对应着更高的ⅤaR值 这是由估计极值分布尾行为时所存在的不确定性决定的。由于没有真实的ⅤaR来衡量估计精 度,因此建议在运用极值分布进行VaR估计时综合考虑基于不同n得到的结果来确定VaR 的估计范围。 对于更长时间的持有期,如何通过极值理论来计算VaR呢?式(11)给出了相应的转换公 JaR(k)=k“vaR(1) (11)
6 整理后可得相应的分位数为: ln[ ln(1 )] 0 {1 [ ln(1 )] } 0 ( ) n n n n n n n n P if P if r n (9) 由于 n n i n t n 1 P P(r r ) [P(r r )] ( ) ( ) , ,则式(10-33)变为: ln[ ln(1 )] 0 {1 [ ln(1 )] } 0 n n n n n n n n P if n P if VaR n (10) 其中 n 是子区间长度。以上即是基于极值理论的 VaR 计算公式,其计算过程可概括如下: 1. 选择子区间的长度 n ,并得到子区间的最小值 { } n,i r ,i=1,…,g,这里 g [T / n] ; 2. 得到 n 、 n 和 n 的极大似然估计并检查极值模型的充分性和有效性; 3. 应用式(10-34)计算 VaR。 以万科 A 股票为例,对其 1997 年 1 月 1 日至 2011 年 12 月 26 日的日对数收益率数进行 极值分布的参数估计。 取 n =21,从表-10 可知 n =0.191、 n =1.686、 n =3.447。对应的置信度为 0.01 的 VaR 值为: {1 [ 21*ln(1 0.01)] } 6.50 0.191 1.686 3.447 0.191 VaR 也就是说,万科 A 股票在 1%置信水平下日对数收益率不会低于-6.50%。 若取 n =42,则有 n =0.135、 n =1.999、 n =4.343。对应的置信度为 1%的 VaR 值为: {1 [ 42*ln(1 0.01)] } 6.17 0.135 1.999 4.343 0.135 VaR 此时,万科 A 股票在 1%置信水平下日对数收益率不会低于-6.17%。 注意到以上案例中,不同的参数 n 对应着不同的 VaR 值,而 n =21 对应着更高的 VaR 值, 这是由估计极值分布尾行为时所存在的不确定性决定的。由于没有真实的 VaR 来衡量估计精 度,因此建议在运用极值分布进行 VaR 估计时综合考虑基于不同 n 得到的结果来确定 VaR 的估计范围。 对于更长时间的持有期,如何通过极值理论来计算 VaR 呢?式(11)给出了相应的转换公 式: VaR(k) k VaR(1) n (11)
其中VaR(1)是由式(11)计算出的持有期为一天的vaR值,VaR(k)为持有期为k天的vaR 值。若取n=21,则持有期为20个交易日的万科A股票1%置信水平下的VaR值为 aR(20)=2019*6,5=1152
7 其中VaR(1)是由式(11)计算出的持有期为一天的VaR值,VaR( k )为持有期为 k 天的VaR 值。若取 n =21,则持有期为 20 个交易日的万科 A 股票 1%置信水平下的 VaR 值为: (20) 20 *6.5 11.52 0.191 VaR