上海证券交易所 上海股市的知情交易概率 及其影响因素 上海证券交易所研究中心 2006年4月 上海谘券交易所 SHANGHAI STOCK EXCHANGE
上海证券交易所 上海股市的知情交易概率 及其影响因素 上海证券交易所研究中心 2006 年 4 月
上海股市的知情交易概率及其影响因素 研究中心施东晖 摘要 ●上海股市知情交易的无条件概率接近40%,远大于Easley,Kiefer.,0Hara& Paperman(1996)和Nyholm(2002,2003)对纽约证券交易所实证分析的结 果。 ●知情交易对价格的影响程度远远大于不知情交易,是知情交易导致了股票价 格根本性的大幅度的变化,而非知情交易只对股票价格形成短暂而微小的冲 击。 ●知情交易概率的日内形态具有如些特点:开盘后的知情交易概率水平最高, 随着交易的进行,信息逐渐传播,知情交易概率也随之下降,但在收盘前又 有所增加。 ●公司的基本面因素会影响股票的知情交易概率,其中,流通市值与知情交易 概率为负相关关系;而财务杠杆比率、主营业务增长率以及股权集中度与知 情交易概率为正相关关系。 ●高流动性和低波动性会吸引知情交易者进场交易,反过来知情交易者的进场 交易将导致流动性降低和波动性增大。 一、如何衡量市场的信息不对称性 信息不对称性和内幕交易行为一直都是各国股市在迈向有效市场路途上备 受关注的课题,但如何衡量信息的不对称性却颇具争议。Hasbrouck(1991)认为, 信息不对称应该是下列三项变量的函数:一是潜在知情交易者的比率;二是发现 私有信息的概率;三是私有信息的准确性。然而,上述观点在实证研究上却面临 相当的困难,因为这三个变量无法直接根据市场数据获得,而必须通过相关的非
上海股市的知情交易概率及其影响因素 研究中心 施东晖 摘要 z 上海股市知情交易的无条件概率接近 40%,远大于 Easley, Kiefer, O’Hara & Paperman(1996)和 Nyholm(2002,2003)对纽约证券交易所实证分析的结 果。 z 知情交易对价格的影响程度远远大于不知情交易,是知情交易导致了股票价 格根本性的大幅度的变化,而非知情交易只对股票价格形成短暂而微小的冲 击。 z 知情交易概率的日内形态具有如些特点:开盘后的知情交易概率水平最高, 随着交易的进行,信息逐渐传播,知情交易概率也随之下降,但在收盘前又 有所增加。 z 公司的基本面因素会影响股票的知情交易概率,其中,流通市值与知情交易 概率为负相关关系;而财务杠杆比率、主营业务增长率以及股权集中度与知 情交易概率为正相关关系。 z 高流动性和低波动性会吸引知情交易者进场交易,反过来知情交易者的进场 交易将导致流动性降低和波动性增大。 一、如何衡量市场的信息不对称性 信息不对称性和内幕交易行为一直都是各国股市在迈向有效市场路途上备 受关注的课题,但如何衡量信息的不对称性却颇具争议。Hasbrouck(1991)认为, 信息不对称应该是下列三项变量的函数:一是潜在知情交易者的比率;二是发现 私有信息的概率;三是私有信息的准确性。然而,上述观点在实证研究上却面临 相当的困难,因为这三个变量无法直接根据市场数据获得,而必须通过相关的非 1
外生变量进行间接衡量。 基于上述思路,早期的研究文献大都以买卖价差、非系统性风险、内部人持 股、公司成长性等指标来间接衡量市场的信息不对称。但事实上,这些度量指标 要么是信息不对称的结果(如价差和非系统性风险),要么是信息不对称的原因(内 部人持股、公司成长性),因此并不能够对信息不对称程度形成清晰而准确的定 量化描述,并且很难在不同证券或不同市场间进行比较和分析。直到最近几年, Easley,Kiefer,O'Hara Paperman(1996),Handa,Schwartz Tiwari(1999), Nyholm(2000)以及Ma,Hsieh和Chen(2000)的研究提出了新的理论分析思路, 用知情交易概率(Probability of Informed Trading)来描述市场上到底有多少的交易 (或投资者)属于知情交易(知情交易者),从而来直接衡量市场的信息非对称程度。 作为转轨经济过程中发展起来的新兴市场,中国证券市场的发育尚不成熟, 上市公司的信息披露不够规范,加上监管手段缺乏及执法力度不够,使得投资者 之间存在较严重的信息不对称性。因此,对中国股市知情交易概率的分析具有重 要的现实意义:一方面可以使监管层对证券市场中的信息不对称水平有一个总体 的认识,然后通过完善交易机制和强化信息披露来降低信息不对称水平;另一方 面有助于我们更加深刻地理解信息在价格形成机制中的角色和作用,动态了解知 情交易的概率水平,甚至可以基于此监控和追踪内幕交易等违法行为。本文的目 的就是通过建构竞价交易制度下知情交易概率的测度模型,对上海股市的知情交 易概率进行定量分析,并分析相关的影响因素。 本文结构如下:除本节引言外,第二节为研究文献综述;第三节基于上海股 市的竞价交易制度,提出一个测度知情交易概率的新模型:第四节介绍研究样本 与数据:第五节运用上海股市的高频交易数据,对上海股市的知情交易概率及其 影响因素进行了实证分析;第六节为本文的结论部份。 二、对既有研究文献的综述 Bagehot(1971)指出,根据投资者所掌握信息的不同,可以将其分为知情交易 者(Informed Trader)和非知情交易者(Uninformed Trader)。其中,知情交易者拥有 关于证券真实价值的私有信息:而非知情交易者主要根据公共信息或谣言进行交 2
外生变量进行间接衡量。 基于上述思路,早期的研究文献大都以买卖价差、非系统性风险、内部人持 股、公司成长性等指标来间接衡量市场的信息不对称。但事实上,这些度量指标 要么是信息不对称的结果(如价差和非系统性风险),要么是信息不对称的原因(内 部人持股、公司成长性),因此并不能够对信息不对称程度形成清晰而准确的定 量化描述,并且很难在不同证券或不同市场间进行比较和分析。直到最近几年, Easley,Kiefer, O’Hara 和 Paperman(1996),Handa,Schwartz 和 Tiwari(1999), Nyholm(2000)以及 Ma,Hsieh 和 Chen(2000)的研究提出了新的理论分析思路, 用知情交易概率(Probability of Informed Trading)来描述市场上到底有多少的交易 (或投资者)属于知情交易(知情交易者),从而来直接衡量市场的信息非对称程度。 作为转轨经济过程中发展起来的新兴市场,中国证券市场的发育尚不成熟, 上市公司的信息披露不够规范,加上监管手段缺乏及执法力度不够,使得投资者 之间存在较严重的信息不对称性。因此,对中国股市知情交易概率的分析具有重 要的现实意义:一方面可以使监管层对证券市场中的信息不对称水平有一个总体 的认识,然后通过完善交易机制和强化信息披露来降低信息不对称水平;另一方 面有助于我们更加深刻地理解信息在价格形成机制中的角色和作用,动态了解知 情交易的概率水平,甚至可以基于此监控和追踪内幕交易等违法行为。本文的目 的就是通过建构竞价交易制度下知情交易概率的测度模型,对上海股市的知情交 易概率进行定量分析,并分析相关的影响因素。 本文结构如下:除本节引言外,第二节为研究文献综述;第三节基于上海股 市的竞价交易制度,提出一个测度知情交易概率的新模型;第四节介绍研究样本 与数据;第五节运用上海股市的高频交易数据,对上海股市的知情交易概率及其 影响因素进行了实证分析;第六节为本文的结论部份。 二、对既有研究文献的综述 Bagehot(1971)指出,根据投资者所掌握信息的不同,可以将其分为知情交易 者(Informed Trader)和非知情交易者(Uninformed Trader)。其中,知情交易者拥有 关于证券真实价值的私有信息;而非知情交易者主要根据公共信息或谣言进行交 2
易,成为噪音交易者Noise Trader),或是仅仅出于流动性需求而进行交易,成为 流动性交易者(Liquidity Trader)。沿袭这一思路,近年来金融学术界提出了一系 列计量模型,来测度和评估市场的知情交易概率和信息不对称水平。 Easley、Kiefer、O'Hara和Paperman(1996),以及Easley、Kiefer和O'Hara(1997) 的论文最早对知情交易概率这一问题进行了研究。他们的研究以做市商市场为背 景,建立了一个做市商在每一交易日面临的委托到达过程的模型,在此基础上以 决策树的方法计算出知情交易者和非知情交易者在面临好消息、坏消息和没有消 息时的委托单到达数,然后以知情交易者的期望委托单到达数为分子,所有交易 者的期望委托单到达数为分母,求出知情交易概率。由于做市商市场下投资者的 委托数与成交笔数等同,因此Easley等人定义的知情交易概率实质上是市场总 成交笔数中知情交易者的成交笔数所占的比例。Easley等人的研究在学术界引起 了较大反响,随后,Heidle&Huang(2000)、Ma,Hsieh&Chen(2000)等在模型 参数、估计方法等方面对这一理论架构进行了修正和拓展 Nyholm(2002)提出了完全不同的知情交易概率测度方法,该方法主要构建在 做市商的报价行为和价差关联性的基础上。做市商根据所有可观察到的信息来推 断一笔交易是来自知情还是非知情交易者,进而可算出一段时间内的知情交易概 率。相对于以前的研究文献,Nyholm(2002)的优点在于运用了成交信息,并且可 以估计每一笔交易或者每一段交易时间内的知情交易概率,这样就可以研究知情 交易概率的变化规律,也符合不同时间知情交易概率不同的常识。Nyholm(2O03) 对模型又进行了相应的拓展,增加考虑了交易量这一因素。 Handa,Schwartz&Tiwari(2003)首先研究了委托驱动市场中的知情交易概 率,他们也采用了决策树方法,但是面对决策树的不再是做市商,而是非知情交 易者。因此,该文中的知情交易概率是交易者中知情交易者的比例,并可根据买 卖价差、委托失衡等信息,通过一定的结构化模型倒推出来。但是,Handa et.al 的模型有着极其严格但又不符合实际的假定,比如假定知情交易者只以市价委托 的形式进行交易,而不能采用限价委托。 总体上来说,上述这些研究利用理论模型和计量经济学方法,在一定的框架 内可以估计市场中知情交易发生的概率,即利用交易和委托数据度量市场的信息 非对称程度,这些模型得到的估计量有更好的经济学含义和现实意义,与信息非 3
易,成为噪音交易者(Noise Trader),或是仅仅出于流动性需求而进行交易,成为 流动性交易者(Liquidity Trader)。沿袭这一思路,近年来金融学术界提出了一系 列计量模型,来测度和评估市场的知情交易概率和信息不对称水平。 Easley、Kiefer、O’Hara和 Paperman(1996),以及 Easley、Kiefer 和 O’Hara(1997) 的论文最早对知情交易概率这一问题进行了研究。他们的研究以做市商市场为背 景,建立了一个做市商在每一交易日面临的委托到达过程的模型,在此基础上以 决策树的方法计算出知情交易者和非知情交易者在面临好消息、坏消息和没有消 息时的委托单到达数,然后以知情交易者的期望委托单到达数为分子,所有交易 者的期望委托单到达数为分母,求出知情交易概率。由于做市商市场下投资者的 委托数与成交笔数等同,因此 Easley 等人定义的知情交易概率实质上是市场总 成交笔数中知情交易者的成交笔数所占的比例。Easley 等人的研究在学术界引起 了较大反响,随后,Heidle & Huang(2000)、Ma, Hsieh & Chen(2000)等在模型 参数、估计方法等方面对这一理论架构进行了修正和拓展 Nyholm(2002)提出了完全不同的知情交易概率测度方法,该方法主要构建在 做市商的报价行为和价差关联性的基础上。做市商根据所有可观察到的信息来推 断一笔交易是来自知情还是非知情交易者,进而可算出一段时间内的知情交易概 率。相对于以前的研究文献,Nyholm(2002)的优点在于运用了成交信息,并且可 以估计每一笔交易或者每一段交易时间内的知情交易概率,这样就可以研究知情 交易概率的变化规律,也符合不同时间知情交易概率不同的常识。Nyholm(2003) 对模型又进行了相应的拓展,增加考虑了交易量这一因素。 Handa, Schwartz & Tiwari(2003)首先研究了委托驱动市场中的知情交易概 率,他们也采用了决策树方法,但是面对决策树的不再是做市商,而是非知情交 易者。因此,该文中的知情交易概率是交易者中知情交易者的比例,并可根据买 卖价差、委托失衡等信息,通过一定的结构化模型倒推出来。但是,Handa et.al 的模型有着极其严格但又不符合实际的假定,比如假定知情交易者只以市价委托 的形式进行交易,而不能采用限价委托。 总体上来说,上述这些研究利用理论模型和计量经济学方法,在一定的框架 内可以估计市场中知情交易发生的概率,即利用交易和委托数据度量市场的信息 非对称程度,这些模型得到的估计量有更好的经济学含义和现实意义,与信息非 3
对称程度的直觉意义也更加接近。但是,由于各国(地区)股市的交易机制具有相 当大的差异,例如,我国沪深证券市场属于纯粹的订单驱动市场,只有限价订单 没有市价订单,不能够直接应用Nyholm(2002,2003)的模型,因此我们借鉴 其建立模型的方法,从完全不同的假设推导出能够适用在竞价市场的知情交易概 率测度模型,并且在参数估计上采用的数学方法也不相同。 三、竞价市场中测量知情交易概率的模型 证券市场上的交易者可以区分为两类:一类是知情交易者(Informed Trader), 是指获得了关于证券真实价值的私有信息,同时利用这些私有信息进行交易的投 资者:另一类是非知情交易者(Uninformed Trader),这类交易者在交易时可能处 于流动性需求而进行交易,成为流动性交易者(Liquidity Trader);或者是根据公 共信息或谣言进行交易,成为噪音交易者(Noise Trader). 定义某股票在时点1时的交易量为Q,该交易量由知情交易者的交易量Q和 非知情交易者的交易量Q“所组成。根据Kyle(1985)在订单驱动连续竞价市场 模式下定义的递归线性均衡(Recursive Linear Equilibrium),交易价格与成交量 存在线性关系,即 △P=g+Q)+, (1) 式中的入反映了交易量对市场价格的影响,为市场深度的倒数。市场深度定 义为市场价格变动一个单位所需要的交易量,如果市场需要很大的交易量才能够 使市场价格波动一个单位,则说明市场深度大。P代表第1笔交易引起的价格 变化,为第1笔交易价格P与第11笔交易价格P,之差。ε,为市场中其他因素引 起的价格变化,比如公开信息的到达使得市场各方同步调整价格,假设ε,服从白 噪声过程。 为了使价格变化与交易量具有对应关系,我们定义一个虚拟变量D,,当交
对称程度的直觉意义也更加接近。但是,由于各国(地区)股市的交易机制具有相 当大的差异,例如,我国沪深证券市场属于纯粹的订单驱动市场,只有限价订单 没有市价订单,不能够直接应用 Nyholm(2002,2003)的模型,因此我们借鉴 其建立模型的方法,从完全不同的假设推导出能够适用在竞价市场的知情交易概 率测度模型,并且在参数估计上采用的数学方法也不相同。 三、竞价市场中测量知情交易概率的模型 证券市场上的交易者可以区分为两类:一类是知情交易者(Informed Trader), 是指获得了关于证券真实价值的私有信息,同时利用这些私有信息进行交易的投 资者;另一类是非知情交易者(Uninformed Trader),这类交易者在交易时可能处 于流动性需求而进行交易,成为流动性交易者(Liquidity Trader);或者是根据公 共信息或谣言进行交易,成为噪音交易者(Noise Trader)。 定义某股票在时点 t 时的交易量为Q ,该交易量由知情交易者的交易量Q 和 非知情交易者的交易量Q 所组成。根据 Kyle(1985)在订单驱动连续竞价市场 模式下定义的递归线性均衡(Recursive Linear Equilibrium),交易价格与成交量 存在线性关系,即 t i u ( ) t i u ∆Pt = λ Q + Q + ε (1) 式中的λ 反映了交易量对市场价格的影响,为市场深度的倒数。市场深度定 义为市场价格变动一个单位所需要的交易量,如果市场需要很大的交易量才能够 使市场价格波动一个单位,则说明市场深度大。∆Pt 代表第 t 笔交易引起的价格 变化,为第 t 笔交易价格 Pt 与第 t-1 笔交易价格 Pt−1之差。 t ε 为市场中其他因素引 起的价格变化,比如公开信息的到达使得市场各方同步调整价格,假设 t ε 服从白 噪声过程。 为了使价格变化与交易量具有对应关系,我们定义一个虚拟变量 Dt ,当交 4
易是由买方主动引起时,D,等于1:而当交易由卖方主动引起时,D,等于一1。 将(1)式改写为: △P=Q,D,+8, (2) 为了衡量知情交易对股票价格及交易量的影响,我们引入一个指标变量L, 当交易量由知情交易者引起时,L,=1;当交易量由不知情交易者引起时,1,=0。 这样,可以将(2)式表示为: △P=(ao+aI,,D,+8, (3) 上式中,α,为非知情交易对价格变化的影响,%为知情交易相对于不知情 交易对价格变化的额外影响 I,又被称作体制(Regime)变量,存在{0,1}两个状态,取值为1的无条件 概率记作p,则取值为0的无条件概率为1-p。因为是否为知情交易由交易者 拥有的信息的自然状态决定,所以我们假定其分布为跨期的i.id.。则可得AP,的 无条件密度 r()--P)exp(aF-a2) 22 (4) [4-(a+a)0]了 +2 -exp 2o2 若已知4P,,则可以形成I,=1的条件概率判断,即交易为知情交易的概率 判断。由条件概率的定义,可以得出 Pr(4,=1h)=r(4g,4=-pxfa= (5) f(AP) f(AP) 根据(7)式就可以完成知情交易概率的测度问题。但是在进行测度之前, 还必须解决未知参数4,a,o2,p的估计问题。令未知参数组成向量
易是由买方主动引起时, 等于 1;而当交易由卖方主动引起时, 等于-1。 将(1)式改写为: Dt Dt t + ε exp exp Pr Pt Qt Dt t ∆ = λ + ε (2) 为了衡量知情交易对股票价格及交易量的影响,我们引入一个指标变量 , 当交易量由知情交易者引起时, t I It = 1;当交易量由不知情交易者引起时,I 。 这样,可以将(2)式表示为: t = 0 ( ) t t Qt D t ∆P = α +α I 0 1 (3) 上式中,α 0 为非知情交易对价格变化的影响, α1 为知情交易相对于不知情 交易对价格变化的额外影响 TI 又被称作体制(Regime)变量,存在{0,1}两个状态,取值为 1 的无条件 概率记作 p ,则取值为 0 的无条件概率为1− p 。因为是否为知情交易由交易者 拥有的信息的自然状态决定,所以我们假定其分布为跨期的 i.i.d.。则可得 的 无条件密度 ∆PT ( ) ( ) ( ) ( ) 2 0 2 2 0 1 2 1 2 2 2 2 T T T T T p P Q f P p P Q ∆ α ∆ πσ σ ∆ α α πσ σ − − = − − + + − (4) 若已知∆PT ,则可以形成 1 TI = 的条件概率判断,即交易为知情交易的概率 判断。由条件概率的定义,可以得出 ( ) ( ) ( ) ( ) ( ) 1 1 Pr 1 T T T T T T T T P ,I p f P I I P f P f P ∆ ∆ ∆ ∆ ∆ = × = = = = (5) 根据(7)式就可以完成知情交易概率的测度问题。但是在进行测度之前, 还必须解决未知参数 α α0 1 , ,σ2 , p 的估计问题。令未知参数组成向量 5
0=(a,a,o2,p),假设有N个时间间隔的观察数据4P和Q,则对数似然函数 为 .)-A:) (6) 该似然函数无法求出解析解,只能够采用数值算法,我们这里提供一种高效 率的算法。取对数似然函数L()的导数并令其等于零,以求解0使L(⑨)达到最 大值,0便是0的最优估计。对数似然的导数为 f(4,) *00 (7 60 根据(6)式我们可以求出(4),得 80 af(4)_(4P,-,,2pr(4,1=0) do (8) [4-(a+a)0,]№pr(aP,= f(_[4-(a+a)9,]9pr(41,=) (9) 0o2 2o3 Pr(4P,1,=0) (10) [4-(a+a)0,了_1 24 Pr(4P,1,=1) (a)-Pr(4B,l,=1)-Pr(aP,=0) (11) ap 将(10)(11)(12)(13)式分别代入(9)式,并令其等于零,可得 6
( 2 0 1 α α, ,σ , p) ′ θ = ,假设有 N 个时间间隔的观察数据∆PT 和Q ,则对数似然函数 为 T ( ) 1 N T L = ∑ ˆ θ ( ) ( ) =1 =1) ( ) 0 ∆P , 1 = − = ) θ = log{ f (∆PT ;θ)} (6) 该似然函数无法求出解析解,只能够采用数值算法,我们这里提供一种高效 率的算法。取对数似然函数 的导数并令其等于零,以求解 使 达到最 大值, 便是θ 的最优估计。对数似然的导数为 L(θ) ˆ θ L(θ) ( ) ( ) 1 1 N T T T L f f P ∆ = ∆ ∂ ∂ = × ∂ ∂ ∑ θ θ θ P (7) 根据(6)式我们可以求出 ∂f (∆PT ) ∂θ ,得 ( ) ( ) ( ) ( ) 0 2 0 0 1 2 Pr 0 Pr T T T T T T T T T T T f P P Q Q P ,I P Q Q P ,I ∆ ∆ α ∆ α σ ∆ α α ∆ σ ∂ − = = ∂ − + + (8) ( ) ( ) ( 0 1 2 1 Pr T T T T T T f P P Q Q P ,I ∆ ∆ α α ∆ α σ ∂ − + = ∂ (9) ( ) ( ) ( ) ( ) 2 0 2 4 2 2 0 1 4 2 1 Pr 2 2 1 Pr 2 2 T T T T T T T T T f P P Q P ,I P Q I ∆ ∆ α ∆ σ σ σ ∆ α α σ σ ∂ − = − ∂ − + + (10) ( ) Pr( ) 1 Pr( 0 T T T T T f P P I P I p ∆ ∆ ∆ ∂ = = − = ∂ (11) 将(10)(11)(12)(13)式分别代入(9)式,并令其等于零,可得 6
62aQ-ig化-r月 (12) 20 a.ug&2p=an月 (13) e,Pr,=la,》 2a9-a0,+(2aa0,+2aa0+0)Pr4,=a9} (14) 。.-e》 (15) N 由0的记作0的任意初始猜测开始,根据(7)式计算Pr(I,=14P),然 后计算式(14)(15)(16)(17)的右侧项,则左侧得出一个新的估计0。用该 估计0重新计算Pr(1,=14P)和式(14)(15)(16)(17)的右侧项,可得2,。 持续这一迭代方式直至0m+与0m的差比指定的收敛标准小为止。该迭代算法 为Dempster,.Laird&Rubin(1977)建立的EM原理的特例,可以证明该算法的 每次迭代都增加了似然函数的数值。 四、研究样本与数据 本文实证研究的数据取自上海证券市场的逐笔申报和成交数据库。申报数据 库包含11个字段的信息,分别是:申报编号、申报日期、申报时间、证券代码、 股东代码、买卖方向、申报价格、申报数量、申报余额、成交标识、申报席位。 成交数据库包含13个字段的信息,分别是:成交编号、成交日期、申报时间、 成交时间、证券代码、股东代码、买卖方向、成交价格、成交数量、本次余额、 >
{ } ( ) 2 1 1 0 2 1 - Pr 1 N T T T T T T N T T P Q ˆ Q I P ˆ Q ∆ α ∆ α = = = = ∑ ∑ (12) { } ( ) ( ) { } ( ) 2 0 1 1 2 1 Pr 1 Pr 1 N T T T T T T N T T T T P Q ˆ Q I P ˆ Q I P ∆ α ∆ α ∆ = = − = = = ∑ ∑ (13) {( ) ( ) ( )} 2 2 2 2 0 1 0 1 1 2 1 2 2 Pr 1 N T T T T T T T T T P Qˆ ˆ P Q ˆ ˆ Q ˆ Q I P ˆ N ∆ α ∆ α α α α ∆ σ = − + − + + = = ∑ (14) { } ( ) 1 Pr 1 N T T T I P ˆ p N ∆ = = = ∑ (15) 由θ 的记作θ( 0 ) 的任意初始猜测开始,根据(7)式计算Pr(IT =1 ∆PT ) (1 ) ,然 后计算式(14)(15)(16)(17)的右侧项,则左侧得出一个新的估计θ 。用该 估计θ(1 ) 重新计算 ( 1 Pr IT = ∆PT ) ( m+1 ) θ 和式(14)(15)(16)(17)的右侧项,可得θ 。 持续这一迭代方式直至θ 与 的差比指定的收敛标准小为止。该迭代算法 为 Dempster, Laird & Rubin(1977)建立的 EM 原理的特例,可以证明该算法的 每次迭代都增加了似然函数的数值。 ( 2 ) (m) 四、研究样本与数据 本文实证研究的数据取自上海证券市场的逐笔申报和成交数据库。申报数据 库包含 11 个字段的信息,分别是:申报编号、申报日期、申报时间、证券代码、 股东代码、买卖方向、申报价格、申报数量、申报余额、成交标识、申报席位。 成交数据库包含 13 个字段的信息,分别是:成交编号、成交日期、申报时间、 成交时间、证券代码、股东代码、买卖方向、成交价格、成交数量、本次余额、 7
成交金额、申报编号、席位代码。 样本区间是2004年4月至2004年9月共117个交易日。由于样本时间比较 长,为防止数据量过于庞大,我们以上证180指数成份股票作为研究对象。基于 其科学客观的选择方法,通常认为上证180指数的成份股票具有很好的代表性, 能够代表上海证券市场的概貌和运行状况。另外,需要指出的是,由于集合竞价 的交易撮合方式完全不同于连续竞价并且交易稀少,所以本文的研究剔除了集合 竞价部分,只选取了连续竞价时段的数据,即上午9:30到11:30和下午13点到 15点之间的数据。 五、实证结果及分析 1.上海股市知情交易概率的描述性分析 为使估计出来的,和α值不至于太小,价格变化4P以分为单位,交易量2, 以万元为单位。分别取1分钟和10分钟作为计算4P,和Q,的时间间隔,令 0=[0.1,11,0.5]应用(7)(13)(14)(15)式进行迭代,终止标准为0m与0m 相比每一项的差异都不超过01%,我们计算出180只股票的参数向量,其均值 和标准差列于表2。由于我们在前面的迭代算法中没有限制参数的取值范围,即 a。≥0、%1≥0、σ2>0和0≤p≤1,在个别计算中会出现p>1的奇异点,解决 方法是不理会该奇异点,取一个不同的初始点进行迭代,便可以找到新的合理的 结果。 表1参数估计结果 o a41 62 取1分钟为 均值 0.102178 1.298788 1.277962 0.429714 时间间隔 标准差 0.084928 0.567020 0.614398 0.174131 取10分钟为 均值 0.044756 0.174810 7.516469 0.377360 时间间隔 标准差 0.071867 0.060993 4.860570 0.206596
成交金额、申报编号、席位代码。 样本区间是 2004 年 4 月至 2004 年 9 月共 117 个交易日。由于样本时间比较 长,为防止数据量过于庞大,我们以上证 180 指数成份股票作为研究对象。基于 其科学客观的选择方法,通常认为上证 180 指数的成份股票具有很好的代表性, 能够代表上海证券市场的概貌和运行状况。另外,需要指出的是,由于集合竞价 的交易撮合方式完全不同于连续竞价并且交易稀少,所以本文的研究剔除了集合 竞价部分,只选取了连续竞价时段的数据,即上午 9:30 到 11:30 和下午 13 点到 15 点之间的数据。 五、实证结果及分析 1.上海股市知情交易概率的描述性分析 为使估计出来的α0 和α1 值不至于太小,价格变化∆PT 以分为单位,交易量Q 以万元为单位。分别取 1 分钟和 10 分钟作为计算 t ∆PT 和Qt 的时间间隔,令 [ ] 0 0 111 0 5 ( ) θ = . ,,, . 0 0 应用(7)(13)(14)(15)式进行迭代,终止标准为θ 与θ 相比每一项的差异都不超过 0.1%,我们计算出 180 只股票的参数向量,其均值 和标准差列于表 2。由于我们在前面的迭代算法中没有限制参数的取值范围,即 ( m+1 ) (m) α ≥ 1 、α ≥ 0、σ2 > 0 和0 ≤ p ≤1,在个别计算中会出现 p >1的奇异点,解决 方法是不理会该奇异点,取一个不同的初始点进行迭代,便可以找到新的合理的 结果。 表 1 参数估计结果 α0 α1 2 σ p 取 均 值 0.102178 1.298788 1.277962 0.429714 1 分钟为 时间间隔 标准差 0.084928 0.567020 0.614398 0.174131 取 均 值 0.044756 0.174810 7.516469 0.377360 10 分钟为 时间间隔 标准差 0.071867 0.060993 4.860570 0.206596 8
,衡量的是不知情交易对价格的影响幅度,而α,衡量的是知情交易对价格 的影响幅度。从表1我们可以发现,远远大于。,说明知情交易对价格的影 响程度远远大于不知情交易,是知情交易导致了股票价格根本性的大幅度的变 化,而不知情交易只对股票价格形成短暂而小的冲击。以10分钟为时间间隔算 得的a,和a,比以1分钟为时间间隔算得的,和a%要小,说明在较长的时间段 内用无论不知情交易还是知情交易都需要更大的交易金额才能够推动股票价格 变化。P为对知情交易无条件概率的测度结果,取时间间隔为1分钟和10分钟 计算得出的结果基本一致,都接近40%,但前者大于后者,说明在更长的时间间 隔内知情交易容易被掩盖,难于被发现。就其数值来说,我国证券市场的知情交 易概率远大于Easley,.Kiefer,O'Hara&Paperman(1996)和Nyholm(2002,2003) 对纽约证券交易所实证分析的结果。这种差异也许可以用我国证券市场的不成 熟、信息传递不畅等原因来解释,但是由于测度模型和市场微观结构有很大差别, 因此不能武断地下此结论。 在4个参数中,我们更关注的是知情交易无条件概率P值。把以10分钟为 时间间隔算得的180只股票P值的分布示于图1,会发现其分布接近于正态。事 实上,以1分钟为时间隔算得的p值的分布与图1十分相似,为了缩减篇幅,不 再列出。应用检验分布是否为正态分布的Jarque-Bera检验。两者都在5%的置信 水平上通过了检验。图1中知情交易无条件概率p值最大的一些股票值得特别关 注,因此本研究方法在某种程度上也有助于证券交易监管
α0 衡量的是不知情交易对价格的影响幅度,而α1 衡量的是知情交易对价格 的影响幅度。从表 1 我们可以发现,α1 远远大于α0 ,说明知情交易对价格的影 响程度远远大于不知情交易,是知情交易导致了股票价格根本性的大幅度的变 化,而不知情交易只对股票价格形成短暂而小的冲击。以 10 分钟为时间间隔算 得的α0 和α1 ,比以 1 分钟为时间间隔算得的α0 和α1 要小,说明在较长的时间段 内用无论不知情交易还是知情交易都需要更大的交易金额才能够推动股票价格 变化。 p 为对知情交易无条件概率的测度结果,取时间间隔为 1 分钟和 10 分钟 计算得出的结果基本一致,都接近 40%,但前者大于后者,说明在更长的时间间 隔内知情交易容易被掩盖,难于被发现。就其数值来说,我国证券市场的知情交 易概率远大于 Easley, Kiefer, O’Hara & Paperman(1996)和 Nyholm(2002,2003) 对纽约证券交易所实证分析的结果。这种差异也许可以用我国证券市场的不成 熟、信息传递不畅等原因来解释,但是由于测度模型和市场微观结构有很大差别, 因此不能武断地下此结论。 在 4 个参数中,我们更关注的是知情交易无条件概率 p 值。把以 10 分钟为 时间间隔算得的 180 只股票 p 值的分布示于图 1,会发现其分布接近于正态。事 实上,以 1 分钟为时间隔算得的 p 值的分布与图 1 十分相似,为了缩减篇幅,不 再列出。应用检验分布是否为正态分布的 Jarque-Bera 检验。两者都在 5%的置信 水平上通过了检验。图 1 中知情交易无条件概率 p 值最大的一些股票值得特别关 注,因此本研究方法在某种程度上也有助于证券交易监管。 9