上海充道大兽 SHANGHAI JIAO TONG UNIVERSITY SHANGHAI JIAO TONG UNIVERSTT 1日日 随机模拟方法与应用课程作业 课程名称:随机模拟方法与应用 学生姓名:马欣楠 学生学号:5111509100
SHANGHAI JIAO TONG UNIVERSITY 随机模拟方法与应用 课程作业 课程名称: 随机模拟方法与应用 学生姓名: 马欣楠 学生学号: 5111509100
基于MCMC的创业公司估值问题研究 摘要 对创业公司的估值只有偶尔才能观察到。要对其风险和收益做出有效估计,必须对样本 选择做出校正。本文介绍一种基于MCMC的动态样本选择法,并采用此方法用创业公司的 风险投资数据对其进行估值。 关键词:MCMC,上市公司估值,动态选择 Abstract Valuations of entrepreneurial companies are only observed occasionally,albeit more frequently for well-performing companies.Consequently,estimators of risk and return must correct for sample selection to obtain consistent estimates.We develop a general model of dynamic sample selection and estimate it using data from venture capital investments in entrepreneurial companies. Our selection correction leads to markedly lower intercepts and higher estimates of risks compared to previous studies. Keywords:MCMC,valuation of entrepreneurial companies,dynamic sample selection 1.引言 许多资产并不经常交易,如个人独资企业,房地产,公司和政府债券,许多期货产品等。 它们的估值只有在交易时才可观察到,所以这些资产的价值和收益数据是不连续的。如果认 为在新一次交易前资产价格一直保持前一次交易的价格不变,对风险和收益的估计会发生偏 差。而如果观测到收益的时间是由于资产自身引起的,则会出现样本选择问题。我们把此称 为动态选择问题,也是本文研究的问题。 动态选择问题非常普遍,在对冲基金、房地产、风险资本投资和私人投资等领域都会出 现。如表现更差的对冲基金更不愿披露收益,也更难在市场上生存。由此导致的自我选择和 生存问题是动态选择问题的一个体现。又如在房地产市场,只能观测到已交易房产的价格。 动态问题则体现在:保留价格(reservation price)较高的卖家卖出房产的可能性更低,而降 价的房产更有可能交易。 本文主要研究了创业公司的风险投资过程。动态选择问题体现在:对公司的估值仅在公 司获得投资或者上市或退市才可观测。对于运营良好的公司,这些事件发生频率更高,这些 公司也更容易在市场生存。研究发现:针对这一问题,动态选择十分重要。对选择过程进行 校正后,期望收益显著降低,而风险显著升高。 我们扩展了风险投资的经验模型。通过增加一个选择过程来校正收益观测值的自身选择 性(endogenous selection),我们将标准动态资产定价模型予以扩展。我们的模型确定了在观 测到的估值和收益之间未观测到的估值和收益。我们将一个动态过滤和平滑模型 (Kalman(1960)and Anderson and Moore(1979)与Ⅱ类型Tobit模型(Heckman(1979)and Amemiya(I985))相结合,采用Gibbs抽样法和Markov Chain Monte Carlo估计,通过迭代
基于 MCMC 的创业公司估值问题研究 摘要 对创业公司的估值只有偶尔才能观察到。要对其风险和收益做出有效估计,必须对样本 选择做出校正。本文介绍一种基于 MCMC 的动态样本选择法,并采用此方法用创业公司的 风险投资数据对其进行估值。 关键词:MCMC,上市公司估值,动态选择 Abstract Valuations of entrepreneurial companies are only observed occasionally, albeit more frequently for well-performing companies. Consequently, estimators of risk and return must correct for sample selection to obtain consistent estimates. We develop a general model of dynamic sample selection and estimate it using data from venture capital investments in entrepreneurial companies. Our selection correction leads to markedly lower intercepts and higher estimates of risks compared to previous studies. Keywords: MCMC, valuation of entrepreneurial companies, dynamic sample selection 1.引言 许多资产并不经常交易,如个人独资企业,房地产,公司和政府债券,许多期货产品等。 它们的估值只有在交易时才可观察到,所以这些资产的价值和收益数据是不连续的。如果认 为在新一次交易前资产价格一直保持前一次交易的价格不变,对风险和收益的估计会发生偏 差。而如果观测到收益的时间是由于资产自身引起的,则会出现样本选择问题。我们把此称 为动态选择问题,也是本文研究的问题。 动态选择问题非常普遍,在对冲基金、房地产、风险资本投资和私人投资等领域都会出 现。如表现更差的对冲基金更不愿披露收益,也更难在市场上生存。由此导致的自我选择和 生存问题是动态选择问题的一个体现。又如在房地产市场,只能观测到已交易房产的价格。 动态问题则体现在:保留价格(reservation price)较高的卖家卖出房产的可能性更低,而降 价的房产更有可能交易。 本文主要研究了创业公司的风险投资过程。动态选择问题体现在:对公司的估值仅在公 司获得投资或者上市或退市才可观测。对于运营良好的公司,这些事件发生频率更高,这些 公司也更容易在市场生存。研究发现:针对这一问题,动态选择十分重要。对选择过程进行 校正后,期望收益显著降低,而风险显著升高。 我们扩展了风险投资的经验模型。通过增加一个选择过程来校正收益观测值的自身选择 性(endogenous selection),我们将标准动态资产定价模型予以扩展。我们的模型确定了在观 测到的估值和收益之间未观测到的估值和收益。我们将一个动态过滤和平滑模型 (Kalman(1960) and Anderson and Moore(1979))与 II 类型 Tobit 模型(Heckman (1979) and Amemiya(1985))相结合,采用 Gibbs 抽样法和 Markov Chain Monte Carlo 估计,通过迭代
模拟以下三个分布产生后验分布:1)贝叶斯回归:2)截断随机变量的抽样(a draw from truncated variables):3)从Kalman Filter产生的一个路径。这三个分布结合起来构成一个估 计的过程。这一算法得出模型中所有参数和隐性变量的后验分布,同时得出所有未观测估值 的估计路径。 我们采用几种方法对算法的稳健性进行分析。首先我们假定误差项服从不同的正态分布, 发现模拟结果对此非常不敏感,然后我们用随机参数模型对不同公司的参数进行估计。模拟 结果对这一条件也非常不敏感。这与我们问题中更加严格的假定相一致。 这一模型的优点是它可以对有限样本进行精确推断,对非高斯参数的非线性函数也可进 行推断。这一模型有一定的局限性:基金的回报基于公司的投资组合,期限通常是10到13 年。由此用基金等级收益(fund level returns)衡量包含不同行业不同公司投资组合的短期回 报较为困难。用模型对单个公司进行估值可以得出更为独立的观测值,从而具有更强的统计 效力。 我们首先阐述了动态选择问题的基本定义:然后描述了我们的经济模型和估计算法:随 后我们用Matlab软件对针对此模型的MCMC程序进行6000次模拟,舍弃最初1000个,得 到5000个样本。最后将我们的模拟数据与实际样本的回归数据进行比较分析,得出结论。 2.动态选择问题 动态选择模型包含一个结果方程(outcome equation): v(t)=v(t-1)+X'(t)0+E(t) (1) v(t)是t时刻估值的对数值,0包含我们关心的参数。估值仅当 1w(t)≥0 (2) 时被观测到。 w(t)是一个隐性选择变量,由选择方程所定义 w(t)=Z'(t)Yo+v(),+7t) (3) 假设(t)⊥7(t),且E(t)]=0,当Y.≠0时会出现样本选择问题。因为在所有已观测 到数据的条件下,EL(t)川data]≠0。直观来讲,当观测到一个估值的概率与此估值本身 有关时会出现样本选择问题。在实际应用中,估值更高的创业公司更有可能获得新的投资, 所以&更高的公司在数据中会更频繁地出现,即EL()川data>O。 当v(t-1)在结果方程时,一个通常的做法是采用两阶段法:首先计算ELs(t)川data, 通过控制函数将计算结果作为结果方程的一个特殊变量,然后再计算Ev(t)川data]在此问 题中,由于观测到的估值的条件期望依赖于期间未观测到的估值,所以需要对未观测值的所 有可能路径进行积分,使得计算十分困难。 3.经济模型和估计过程
模拟以下三个分布产生后验分布:1)贝叶斯回归;2)截断随机变量的抽样(a draw from truncated variables);3)从 Kalman Filter 产生的一个路径。这三个分布结合起来构成一个估 计的过程。这一算法得出模型中所有参数和隐性变量的后验分布,同时得出所有未观测估值 的估计路径。 我们采用几种方法对算法的稳健性进行分析。首先我们假定误差项服从不同的正态分布, 发现模拟结果对此非常不敏感,然后我们用随机参数模型对不同公司的参数进行估计。模拟 结果对这一条件也非常不敏感。这与我们问题中更加严格的假定相一致。 这一模型的优点是它可以对有限样本进行精确推断,对非高斯参数的非线性函数也可进 行推断。这一模型有一定的局限性:基金的回报基于公司的投资组合,期限通常是 10 到 13 年。由此用基金等级收益(fund level returns)衡量包含不同行业不同公司投资组合的短期回 报较为困难。用模型对单个公司进行估值可以得出更为独立的观测值,从而具有更强的统计 效力。 我们首先阐述了动态选择问题的基本定义;然后描述了我们的经济模型和估计算法;随 后我们用 Matlab 软件对针对此模型的 MCMC 程序进行 6000 次模拟,舍弃最初 1000 个,得 到 5000 个样本。最后将我们的模拟数据与实际样本的回归数据进行比较分析,得出结论。 2.动态选择问题 动态选择模型包含一个结果方程(outcome equation): v t v t X t t ( ) ( 1) '( ) ( ) (1) vt() 是 t 时刻估值的对数值, 包含我们关心的参数。估值仅当 w t( ) 0 (2) 时被观测到。 wt() 是一个隐性选择变量,由选择方程所定义 0 ( ) '( ) ( ) ( ) w t Z t v t t v (3) 假设 ( ) ( ) t t ,且 E t [ ( )] 0 ,当 0 v 时会出现样本选择问题。因为在所有已观测 到数据的条件下, E t data [ ( ) | ] 0 。直观来讲,当观测到一个估值的概率与此估值本身 有关时会出现样本选择问题。在实际应用中,估值更高的创业公司更有可能获得新的投资, 所以 更高的公司在数据中会更频繁地出现,即 E t data [ ( ) | ] 0 。 当 v t( 1) 在结果方程时,一个通常的做法是采用两阶段法:首先计算 E t data [ ( ) | ] , 通过控制函数将计算结果作为结果方程的一个特殊变量,然后再计算 E v t data [ ( ) | ] 在此问 题中,由于观测到的估值的条件期望依赖于期间未观测到的估值,所以需要对未观测值的所 有可能路径进行积分,使得计算十分困难。 3. 经济模型和估计过程
3.1估值过程 假设某一经济体有价格为B()的无风险债券,连续复利由下式给出: dB(t)=rdt (4) B(t) 市场投资组合的价值符合布朗运动: dM()=Bdt+dw( (5) M(t) 设对一个给定公司的估值是V(),由单因素市场模型得到: dv(t) -rdt adt+B( (6) V(t) dM()-rdt)+adw(t) `M() 估值过程的额外收益是a,对每一单位B,dW(t)与dW,(t)相互独立。定义连续复利收 益: r(t,t)-(t'-t)r=('-)6+Bm(t,t)-(t-t)r)+(t,t) (7 (t,t')服从N(0,(t'-t)o2)分布,定义v(t)=lnV(t)],从t=t'-1开始,我们到达估值方 程的一阶段转移方程: v(t)=v(t-1)+r+δ+B(rm(t)-r)+(t) (8) N(0o,④=lnM0/Mu-川这是将X)-0- []w 式所得的方程。 3.2选择过程 仅当公司新获投资或上市、退市时估值才可观测到。这些事件的内在关联性由选择过程 处理。按照方程(2)、(3),估值仅当 1w()≥0 (9) 时被观测到。 w(t)是一个隐性选择变量,由选择方程所定义 w()=Z()Yo+v()+n(t) (10) 向量Z'()包含影响新获投资或上市、退市的因素,包括一个常数项,从上一轮投资到现在 的时间(一次项和平方项)以及捕获一般市场条件的变量。方程(10)的第二项是估值的对 数值。通过将前一轮投资估值的对数值乘以一个系数-Y,包含在Z()中,我们可以将Y,阐释
估值过程 假设某一经济体有价格为 Bt() 的无风险债券,连续复利由下式给出: ( ) ( ) dB t rdt B t (4) 市场投资组合的价值符合布朗运动: ( ) ( ) ( ) m m m dM t dt dW t M t (5) 设对一个给定公司的估值是 V t() ,由单因素市场模型得到: ( ) ( ) ( ) ( ) ( ) ( ) dV t dM t rdt dt rdt dW t V t M t (6) 估值过程的额外收益是 ,对每一单位 ,dW t( ) 与 ( ) m dW t 相互独立。定义连续复利收 益: ( , ') ( ' ) ( ' ) ( ( , ') ( ') ) ( , ') v m r t t t t r t t r t t t t r t t (7) ( , ') t t 服从 2 N t t (0,( ' ) ) 分布,定义 v t V t ( ) ln[ ( )] ,从 t t ' 1 开始,我们到达估值方 程的一阶段转移方程: ( ) ( 1) ( ( ) ) ( ) m v t v t r r t r t (8) ( ( ) ln[ ( ) / ( 1)] m r t M t M t 这是将 1 ( ) ( ) m X t r t r , = r 代入() 式所得的方程。 选择过程 仅当公司新获投资或上市、退市时估值才可观测到。这些事件的内在关联性由选择过程 处理。按照方程()、(),估值仅当 w t( ) 0 (9) 时被观测到。 wt() 是一个隐性选择变量,由选择方程所定义 0 ( ) '( ) ( ) ( ) w t Z t v t t v (10) 向量 Z t '( ) 包含影响新获投资或上市、退市的因素,包括一个常数项,从上一轮投资到现在 的时间(一次项和平方项)以及捕获一般市场条件的变量。方程(10)的第二项是估值的对 数值。通过将前一轮投资估值的对数值乘以一个系数- v 包含在 Z t() 中,我们可以将 v 阐释
为从前一轮投资以来获得收益的系数。由于运营更成功的公司的估值更频繁地被观测到,我 们期望Y,为正值。我们假定7(t)独立同分布,均服从N(0,1)的标准正态分布。 总的来说,模型包含两个方程。估值方程(8)和选择方程(10)。仅当w(t)≥0时v(t) 才可被观测到。误差项均独立同分布,ε~N(0,σ),7(t)~N(0,1)。我们所感兴趣的参数是 6,B,2和y=(Yo.)。 3.3估计过程概述 我们用贝叶斯-吉布斯抽样过程将我们的模型分解成三部分:第一部分包含估值变量。 数据中大多数估值过程是未被观测到的,这一部分把未被观测到的估值作为模型内的参数对 其进行估计。第二部分包括选择变量。第三部分包括我们感兴趣的参数。Gibs抽样法对这 三个部分的变量和参数进行迭代,最终模拟出模型校正后的联合后验分布。第二、三部分较 为简单。根据(9)、(l0)式的定义,我们从截断正态分布(truncated normal distribution)中 对第二部分的选择变量进行抽样:根据(8)、(10)式,用两个标准贝叶斯线性回归对第三 部分估值方程和选择方程中的参数进行估计。 第一部分中,对估值变量进行抽样是整个过程中最复杂的部分。这一部分需要探究未被 观察的估值在各参数、选择变量、市场回报,以及估值未被观察这一事实本身的条件下的整 个路径。我们使用Carter和Kohn 1994年提出的向前过滤、向后取样法(Forward Filtering Backwards Sampling,FFBS),这一方法提供了一种在所有已有信息下对隐性变量可能路径 进行取样的有效途径。 FBS算法规定模型在参数和选择变量的条件下是一个线性状态空间,隐性变量的路径 可以由通过Kalman过滤(Kalman filter)重现。从这一观点看,v(t)是未观测的状态变量, 估值方程(8)将r+δ+((1)-r)作为作用于状态的可观测的控制,由此规定了状态转 移规则。状态空间有一个或两个观测方程,取决于估值是否被观测到。选择变量W()可以 视作()的噪声观测,第一个观测方程即为式(8),当一次估值被观测到时,观测方程提供 当前状态的直接观测值,并有lVos()]=v(t),'os(t)是观测到的估值。我们假定所有观 测到的估值都是没有偏差的。 我们使用不同的先验分布和参数的初始值进行估计,进行了6000次Gibbs抽样迭代, 弃去开始1000次的结果来模拟后验分布。在开始的1000次迭代中,模拟结果收敛迅速。我 们又对算法的稳定性和收敛性进行验证,包括去除对高斯误差项的假设,去掉不同公司的 和B恒定不变的假设等。 4.数据阐释 月度市场收益和Fama-French投资组合的回报从Kenneth French网站获取,包括NYSE, AMEX和NASDAQ的上市公司。月度国库贴现率也可在网站获取。 4.1风险投资数据
为从前一轮投资以来获得收益的系数。由于运营更成功的公司的估值更频繁地被观测到,我 们期望 v 为正值。我们假定 ()t 独立同分布,均服从 N(0,1)的标准正态分布。 总的来说,模型包含两个方程。估值方程(8)和选择方程(10)。仅当 w t( ) 0 时 vt() 才可被观测到。误差项均独立同分布,( ,()t N(0,1)。我们所感兴趣的参数是 , , 和 =( ) 0 v , 。 3.3 估计过程概述 我们用贝叶斯-吉布斯抽样过程将我们的模型分解成三部分:第一部分包含估值变量。 数据中大多数估值过程是未被观测到的,这一部分把未被观测到的估值作为模型内的参数对 其进行估计。第二部分包括选择变量。第三部分包括我们感兴趣的参数。Gibbs 抽样法对这 三个部分的变量和参数进行迭代,最终模拟出模型校正后的联合后验分布。第二、三部分较 为简单。根据(9)、(10)式的定义,我们从截断正态分布(truncated normal distribution)中 对第二部分的选择变量进行抽样;根据(8)、(10)式,用两个标准贝叶斯线性回归对第三 部分估值方程和选择方程中的参数进行估计。 第一部分中,对估值变量进行抽样是整个过程中最复杂的部分。这一部分需要探究未被 观察的估值在各参数、选择变量、市场回报,以及估值未被观察这一事实本身的条件下的整 个路径。我们使用 Carter 和 Kohn 1994 年提出的向前过滤、向后取样法(Forward Filtering Backwards Sampling,FFBS),这一方法提供了一种在所有已有信息下对隐性变量可能路径 进行取样的有效途径。 FFBS 算法规定模型在参数和选择变量的条件下是一个线性状态空间,隐性变量的路径 可以由通过 Kalman 过滤(Kalman filter)重现。从这一观点看,vt() 是未观测的状态变量, 估值方程(8)将 ( ( ) ) m r r t r 作为作用于状态的可观测的控制,由此规定了状态转 移规则。状态空间有一个或两个观测方程,取决于估值是否被观测到。选择变量 wt() 可以 视作 vt() 的噪声观测,第一个观测方程即为式(8),当一次估值被观测到时,观测方程提供 当前状态的直接观测值,并有 ln[ ( )] ( ) V t v t OBS , ( ) V t OBS 是观测到的估值。我们假定所有观 测到的估值都是没有偏差的。 我们使用不同的先验分布和参数的初始值进行估计,进行了 6000 次 Gibbs 抽样迭代, 弃去开始 1000 次的结果来模拟后验分布。在开始的 1000 次迭代中,模拟结果收敛迅速。我 们又对算法的稳定性和收敛性进行验证,包括去除对高斯误差项的假设,去掉不同公司的 和 恒定不变的假设等。 4.数据阐释 月度市场收益和Fama-French投资组合的回报从Kenneth French网站获取,包括NYSE, AMEX 和 NASDAQ 的上市公司。月度国库贴现率也可在网站获取。 4.1 风险投资数据
风险投资数据由Sand Hill Ecnometrics提供。 4.2计算收益 投资前估值和投资后估值的数值是不同的。若风险投资者向一家公司投资I后,公司的 估值为'os7,则投资前公司的估值可定义为:'pos='e+I,从t到r相邻两轮投资之 间投资者获得的净回报为: R(1,1)=VPRE(t)/VPoST(t) (11) 我们用这些回报构造一个新的估值变量,以消除未来投资者的股权收益减损影响。从V(0)=1 开始,校正估值可由下式迭代计算: Vous(t)=VoBs(t)xR(t,t) (12) 校正估值在估计过程中可作为估值的观测值。 我们的样本最终包含1934家公司的5501次投资,其中199家上市,451家被收购,445家 被清算,还有839家我们无法得知它们如今的状况。 5.MCMC模拟 我们通过模拟,产生了10个公司120个月的1000组数据,模拟模型为 v(t)=v(t-1)+r+δ+B(rm(t)-r)+(t) (13) w(t)=Yo+v(t)+Y2t+3t2+7) (14) v(t)=l(V(t)是w(t)≥0时的隐性选择变量。市场收益回报r(t)的对数值独立同分布,服 从N(0,1/12),T是自从上一次观测到的估值为止的时间。误差项(t)~N(0,σ2), 7t)~N(O,1),二者相互独立。我们设无风险利率r为0。 我们设6、B及(o,Y,)的先验均值为0,。=1/10,000,2。=1/100。o2服从逆 Gamma先验分布,a0=2.1,b0=1/600,E[g]=4%,每月0以99%的置信度在1%到12%之间。 基于以上条件,选择N(0,42)作为6、B的先验分布,N(0,10)作为Yo,Y,的先验分布。 我们设δ、B、(Yo,Y,)初始值为0,0初始值为10%开始进行模拟。 忽略了选择过程的MCMC法得出Y,=O,而包括选择过程的MCMC是我们的动态选择 法。对于每一个变量,第一个值为由数据的点估计平均值产生。模拟结果见图1、图2与表 1
风险投资数据由 Sand Hill Ecnometrics 提供。 4.2 计算收益 投资前估值和投资后估值的数值是不同的。若风险投资者向一家公司投资 I 后,公司的 估值为 VPOST ,则投资前公司的估值可定义为:V V I POST PRE ,从 t 到 t’相邻两轮投资之 间投资者获得的净回报为: ( , ') ( ') / ( ) R t t V t V t v PRE POST (11) 我们用这些回报构造一个新的估值变量,以消除未来投资者的股权收益减损影响。从 V(0 =1 ) 开始,校正估值可由下式迭代计算: ( ') ( ) ( , ') V t V t R t t OBS OBS v (12) 校正估值在估计过程中可作为估值的观测值。 我们的样本最终包含 1934 家公司的 5501 次投资,其中 199 家上市,451 家被收购,445 家 被清算,还有 839 家我们无法得知它们如今的状况。 5. MCMC 模拟 我们通过模拟,产生了 10 个公司 120 个月的 1000 组数据,模拟模型为 ( ) ( 1) ( ( ) ) ( ) m v t v t r r t r t (13) 2 0 1 2 3 w t v t t ( ) ( ) ( ) (14) v t V ( ) ln( (t)) 是 w t( ) 0 时的隐性选择变量。市场收益回报 ( ) m r t 的对数值独立同分布,服 从 2 N(0,1 /12) , 是自从上一次观测到的估值为止的时间。误差项 2 ( )~ N(0, ) t , ( )~ N(0,1) t ,二者相互独立。我们设无风险利率 r 为。 我们设 、 及 0 ( , ) v 的先验均值为,0= /10,000 I ,0= /100 I 。 2 服从逆 Gamma 先验分布,a0=2.1,b0=1/600,E[ ]=4%,每月 以 99%的置信度在 1%到 12%之间。 基于以上条件,选择 2 N(0,4 ) 作为 、 的先验分布, 2 N(0,10 ) 作为 0 , v 的先验分布。 我们设 、 、 0 ( , ) v 初始值为, 初始值为开始进行模拟。 忽略了选择过程的 MCMC 法得出 v ,而包括选择过程的 MCMC 是我们的动态选择 法。对于每一个变量,第一个值为由数据的点估计平均值产生。模拟结果见图 1、图 2 与表 1
800 800 600 600 400 400 200 200 82 -0.01 0 0.01 0.02 2 500 400 300 200 100 809 0.09 0.10.110.12013 Y2 600 600 0 5 7 -0.5 6 0 3 14 Y4 % 600 T 100 10 0 0.05 0.1 0.15 02 x103 图1 MCMC模拟抽样结果
图 1 MCMC 模拟抽样结果
B 0.02 0.01 i o T1T 0.01 0.02 100020003000400050006000 100020003000400050006000 Iteration Iteration 0.13 0.12 0.1 0.09 0.08 100020003000400050006000 Iteration ¥1 2 15 -0.5 10 15 12002400 3600 48006000 12002400360048006000 0.3 103 0.5 0.2 0 .1 -0.1 15 1200240036004800 6000 12002400360048006000 图2MCMC抽样状态转移轨迹
图 2 MCMC 抽样状态转移轨迹
表1MCMC抽样后验分布参数 参数 平均值 标准差 真实值 o -0.0004392 0.003145 0 1.0994 0.2654 1.0000 B o 0.1010 0.0059 0.1000 -1.0215 0.1102 -10000 9.7117 1.0329 10.0000 0.0917 0.0250 0.1000 Y3 0.0001 0.0003 0 Ya 6.选择误差的比较分析 为了评价选择过程可能带来的误差,我们将动态选择法的MCMC模拟数据与OLS(最 小二乘法)、GLS(广义最小二乘法)和未校正选择误差的MCMC模拟数据进行比较。对于 OLS和GLS估计,我们计算样本数据额外收益的对数值,对相应的额外市场收益进行回归。 对OLS,有: r(t,t)-(t'-t)r=(t'-1)6oLs+Bois(r(t,t)-(1-1)r)+EoLs (15) 8os~N(0,(t'-t)o2) 对于GLS,有: r,)-(0y=-Ij6as+Bcs (r(t,t)-(t-1r) (16) t'-D √t'-t) &GLS 6os和6cs统称为截距,与(7)式中的6相对应。 比较结果如表2所示。OLS和GLS相比,可以看出OLS估计的截距更小,表示月波动 更小。OLS估计给予时间跨度较长的样本实际观测值更大的权重,更小的截距意味着这些 实际观察值比时间跨度较短的观察值月收益更低。这与标准几何布朗运动并不一致,后者的 月收益与时间间隔无关。但是如图1所示,这符合选择过程。图3刻画了有漂移项(dif) 的标准几何布朗运动。漂移项是图上的斜直线。这一过程在某个阈值(水平实线)之上被观 察到,黑点表示观察到的数据,灰点表示未观察到的数据。A点表示1=1/2后观测值的平 均值,B点代表1=2时观察值的平均值。在此点可以观察到的条件下,这一过程需要一个 较低的平均漂移值,如经过B点的虚线所示。这与表中OLS比GLS的截距要小的结果相一 致。 和GLS估计结果相似,MCMC模拟结果表明,经选择过程校正后,RMRF从2.358升 至3.010,而表征市场波动性的σ从0.0864升至0.0990。图2阐明了选择过程的影响。图中 的数据由标准资本资产定价模型(CAPM)关系产生,但只有额外收益是正值时才被观测到
表 1 MCMC 抽样后验分布参数 参数 平均值 标准差 真实值 -0.0004392 0.003145 0 1.0994 0.2654 1.0000 0.1010 0.0059 0.1000 1 -1.0215 0.1102 -1.0000 2 9.7117 1.0329 10.0000 3 0.0917 0.0250 0.1000 4 0.0001 0.0003 0 6.选择误差的比较分析 为了评价选择过程可能带来的误差,我们将动态选择法的 MCMC 模拟数据与 OLS(最 小二乘法)、GLS(广义最小二乘法)和未校正选择误差的 MCMC 模拟数据进行比较。对于 OLS 和 GLS 估计,我们计算样本数据额外收益的对数值,对相应的额外市场收益进行回归。 对 OLS,有: ( , ') ( ' ) ( ' ) ( ( , ') ( ') ) v OLS OLS m OLS r t t t t r t t r t t t t r (15) 2 ~ (0,( ' ) ) OLS N t t 对于 GLS,有: ( , ') ( ' ) ( ( , ') ( ') ) ( ' ) ( ' ) ( ' ) v m GLS GLS GLS r t t t t r r t t t t r t t t t t t OLS 和 GLS 统称为截距,与(7)式中的 相对应。 比较结果如表 2 所示。OLS 和 GLS 相比,可以看出 OLS 估计的截距更小,表示月波动 更小。OLS 估计给予时间跨度较长的样本实际观测值更大的权重,更小的截距意味着这些 实际观察值比时间跨度较短的观察值月收益更低。这与标准几何布朗运动并不一致,后者的 月收益与时间间隔无关。但是如图 1 所示,这符合选择过程。图 3 刻画了有漂移项(drift) 的标准几何布朗运动。漂移项是图上的斜直线。这一过程在某个阈值(水平实线)之上被观 察到,黑点表示观察到的数据,灰点表示未观察到的数据。A 点表示 t 1/ 2 后观测值的平 均值,B 点代表 t 2 时观察值的平均值。在此点可以观察到的条件下,这一过程需要一个 较低的平均漂移值,如经过 B 点的虚线所示。这与表中 OLS 比 GLS 的截距要小的结果相一 致。 和 GLS 估计结果相似,MCMC 模拟结果表明,经选择过程校正后,RMRF 从 2.358 升 至 3.010,而表征市场波动性的 从 0.0864 升至 0.0990。图 2 阐明了选择过程的影响。图中 的数据由标准资本资产定价模型(CAPM)关系产生,但只有额外收益是正值时才被观测到
与我们的经验发现相一致,比起真实情况,图中的观测值斜率偏小,截距偏大,非系统风险 偏大。 表2动态选择MCMC与无选择MCMC,OLS,GLS对比 True OLS GLS MCMC MCMC (no selection)(w/selection) Valuation Equation Intercept 0.0 -0.0038 0.0077 0.0077 0.0001 (0.0001) (0.0001) (0.0001) (0.0001) RMRF 3.0 1.1926 2.3578 2.3585 3.0100 (0.0122) (0.0123) (0.0124) (0.0118) Sigma 0.1 0.1468 0.0875 0.0864 0.0118 (0.0003) (0.0002) (0.0002) (0.0003) Selection Equation Return 10.0 10.6303 (0.0484) Time 0.1 0.1078 (0.0011) Time- 0.0 0.0000 Squared (0.0000) Constant -1.0 -1.0241 (0.0052) V()/V(O) 0 1 2 time 图3几何布朗运动模型与漂移项
与我们的经验发现相一致,比起真实情况,图中的观测值斜率偏小,截距偏大,非系统风险 偏大。 表 2 动态选择 MCMC 与无选择 MCMC,OLS,GLS 对比 True OLS GLS MCMC (no selection) MCMC (w/selection) Valuation Equation Intercept 0.0 -0.0038 (0.0001) 0.0077 (0.0001) 0.0077 (0.0001) 0.0001 (0.0001) RMRF 3.0 1.1926 (0.0122) 2.3578 (0.0123) 2.3585 (0.0124) 3.0100 (0.0118) Sigma 0.1 0.1468 (0.0003) 0.0875 (0.0002) 0.0864 (0.0002) 0.0118 (0.0003) Selection Equation Return 10.0 10.6303 (0.0484) Time 0.1 0.1078 (0.0011) TimeSquared 0.0 0.0000 (0.0000) Constant -1.0 -1.0241 (0.0052) 图 3 几何布朗运动模型与漂移项