您所在的位置: 首页>正文
给未来建模提供可行路径
本系列文共上下两篇。上篇回顾了两篇在国际学界引用广泛的实际波动率研究开山之作,下篇借鉴其思路,结合本土市场特征,将核心成果在我国商品、金融期货市场上做了复现和再探索。我们发现,尽管许多经典成果(例如波动率大致呈log-normal分布、波动率具有长记忆性、波动率和相关性同涨同跌趋势很强等)放在今天的市场依然成立,有些广为人知的成果需要被进一步阐释(如波动率的聚集性该如何理解、权益市场上的收益和波动负相关的特征有多明显等)。我们还发现,波动率的长记忆性可以被分整参数(Fractionally Integrated Model)模型较好地解释,这给未来建模提供了可行路径。我们希望本篇报告中的实证结果可以成为后续研究的有力参考,在研究思路选择和模型合理性判断上提供助力。
本文结构如下:上篇对Andersen 2001(a)和Andersen 2001(b)两篇研究中的核心实证成果做回顾。下篇第一小节将基于这些成果给出我们的实验设计,并介绍重点关注品种和品种对应的挑选思路。第二小节将详细展示我们的实证结果。第三小节将对重要实证结果做总结。
The Distribution of Realized Exchange Rate Volatility(Andersen 2001a)由Andersen et al.在2001年发表于Journal of the American Statistical Association。同年,同一批作者在Journal of Financial Economics上发表了The Distribution of Realized Stock Return Volatility (Andersen 2002b)。截至本文成稿,两篇文章分别被引用3019次、2989次(google scholars数据),在realized volatility话题下名列前茅。
Andersen 2001a将目光集中在DM/$和Yen/$两个外汇品种的波动率上,从波动率的分布特征、时间序列特征和周期聚合下前两者的稳定性三个角度阐述了波动率的规律。Andersen 2001b对道琼斯工业指数中的30只成分股复现了上述研究,进一步总结了各个特征在不同标的上的具体表现,并对波动率在牛市、熊市中的非对称变化做了探索。两篇文章都强调了Fractionally Integrated Models(fractionally integrated model)对波动率的解释作用。由于两篇文章思路大致相仿,我们将遵照第一篇文章的顺序对重要的实证结论做展示。
收益数据来源和波动率构造方法
Andersen 2001a的主要研究对象是DM/$和Yen/$自1986年12月1日到1996年12月1日,共3653个交易日的日内5分钟log return。该时序构造自Olsen and Associates提供的tick报价:每个5分钟bar的收盘价由最近两个tick的bid-ask中间价几何平均而来。数据剔除了周末、节假日期间市场不活跃的时间段,并对个别交易日内tick数据缺失的情况做了处理。最终,两个外汇时间序列共有704160个5分钟bar构成,合计2445个完整的交易日。
Andersen 2001b的主要研究对象是道琼斯工业指数(DJIA)在1997年3月的30只成分股从1993年1月2日到1998年5月29日的日内5分钟log return。数据构造自Trade And Quote(TAQ)database统计的来自NYSE、AMEX、NASDAQ三家交易所的聚合tick报价,5分钟bar收盘价的构造方法和外汇类似(股票的成交时间间距普遍大于外汇,这会向基于相邻tick的interpolation中引入人为的负相关性,作者对此做了调整)。最终,研究对象为30个5分钟bar时间序列,每个时间序列长度为107、914,覆盖1366个完整的交易日。
基于5分钟收益序列,作者构建了多种波动率度量方法,包括:
1.收益的日方差(var)。每个交易日的日方差为当日所有5分钟bar的收益的平方和。需要注意的是,作者在计算方差时将均值假定为0。这么做一是因为所有考察的时间序列5分钟的收益均值和0的差别统计不显著;二是因为有研究表明,即使真实的收益均值不为0,假设其为0仍能极大地缩小方差估算的波动。
2.收益的日标准差(std),即当日日方差的平方根。
3.收益的log标准差(log_std),即当日日标准差的log。
4.收益的日内协方差(cov_i_j)和日内相关性(corr_i_j),即当日标的i和标的j日内5分钟收益的皮尔森相关系数,在计算Covariance同样假设各自均值为0。
为便于讨论,我们将上述测度笼统地称为Realized Volatility(RV)。在探讨具体某一项测度的性质时,我们会具体阐明其简称。
用高频收益序列还原真实波动率的理论基础
作者指出,尽管波动率无法被直接观测,(在高频收益自相关性很低的假设下)通过高频收益计算得到的RV是真实波动率的良好替代。其理论基础如下:
假设log价格服从下述随机过程(该模型是一个普适性非常强的价格模型,对价格的要求仅有无记忆性/memoryless property,这和有效市场假说基本一致),
其中Wt为布朗运动,σt是个满足恰当平滑条件的随机过程,且两者相互独立。那从t=0 到t=1时间内,log return服从如下分布:
这段时间内log return的波动率
这就是标的收益在这段时间内真实的波动率,学界称之为integrated volatility。
由于无法观测到{σt},我们自然无法计算真实波动。所幸Barndorff-Nielsen & Shephard(1998)指出,只要{rt }序列没有自相关性,且{σt2}是个连续的随机过程(等价于σt满足cadlag条件),高频收益的平方和会向真实波动收敛,即:
(关于收敛速度的讨论请见Barndorff-Nielsen & Shephard(1998))
用通俗的语言来讲,即假设价格和波动率可以被一些普适性模型捕捉,那只要收益序列够高频,一段时间内收益的平方和就可以还原标的的真实波动率。
现实当中如果价格序列采样过于频繁,获得的数据点有可能受到市场微观结构噪音的污染。作者认为5分钟的频率是波动率测量收敛和高频噪音污染间一个较好的平衡点,但这个判断是个“基于经验的判断(largely empirical)”,作者并没有给出更多的理论支持。考虑到后续大量的实际波动率研究都采用了类似的频率,且该频率也在业界广泛使用,我们认为基于5分钟bar的构造方法是合理的。
波动率的单变量分布
日标准差大致呈对数正态分布。Andersen 2001a发现,DM/$和Yen/$两个外汇的各个RV测度有如下特征:
日方差右偏明显,偏度在3.5以上;日标准差右偏略小些,在1.5~2.0之间;log日标准差的偏度很小,在0.5以下,其峰度在3.2左右,接近标准正态分布的3.0。这一特征说明两点:
第一,标的收益大概率是异方差的。日方差是高频收益的平方和,如果收益本身是i.i.d的,那收益的平方也应该是i.i.d的(见下)。根据极限中值定理,收益的平方和在N足够多的情况下应该服从正态分布。日方差右偏严重,显然违背正态分布,所以收益i.i.d假设有误。但是考虑到收益本身自相关性很低,很难说有足够证据违背了Independent的假设,所以大概率是产生收益的分布随着时间有变化,异方差就是其中的一种可能性。
第二,高波动偏离均值的幅度比低波动要大得多。注意到平方根和取log都是凸函数,其作用就是使大值和小值之间的差距缩小。日标准差还要经过一次log变换才呈现出正态,说明日标准差向上偏离均值的幅度比向下要大得多。
Correlation基本呈正态分布,且分布围绕均值颇为紧密。日相关性的均值为43.5%,标准差为16%,偏度为-0.203,峰度为2.71。这也就是说两个外汇序列的日间相关性有95%的概率在11.5%~75.5%之间波动。这个值可以帮助我们判断市场系统性风险的大小。
股票的波动率比外汇厚尾现象更严重。Andersen 2001b在权益市场上发现了类似结果。考察的30只股票,多数日方差右偏严重、log标准差呈正态分布。更确切地说,30只股票的log日标准差波动偏度的均值为0.222,说明多数标的的日标准差波动围绕均值左右对称;峰度均值为4.101,对比外汇市场的3.2要高出许多,说明股票波动率偏离均值的幅度比外汇更大。
Andersen 2001b还考察了标的收益的分布。不出意料,30只股票的日log收益均值接近于0,且峰度为5.908,厚尾现象明显。有意思的是,当用每天的实际波动率(日标准差)对收益序列做归一化处理后,该数据集基本呈正态分布。这或多或少为dlogpt=σt dWt的模型结构提供了证据。
波动率的多变量特征
DM/$和Yen/$波动率相关性为55.3%;股票间波动率相关性多数在20 %±17%区间内。
Andersen 2001a 发现在所有波动率度量方法下,DM/$和Yen/$的日度RV相关性都很明显,且幅度一致:日方差的相关性为53.8%,日标准差相关性为55.3%,log标准差的相关性为51.3%。通俗地说,两个外汇波动率同涨同跌的趋势很明确。这说明波动率可能是由一个共同的因子驱动的。
由此得到的一种建模思路如下:
其中pt是一个N×1的向量,表示N个资产的log price。σt是一个表征波动率共有因子的随机过程,在现实中可能对应某个宏观变量对波动率的影响;λ也是N×1的向量,表示共有因子在每个标的波动率上的荷载;dWt表示一个随机误差。Ωt是一个对角矩阵,其中每个元素表征了每个标的独有的波动率成分,也都是随机过程;dVt是一个N×1维度的随机向量,各个组分为相互独立的布朗运动,表示施加于独有成分的随机误差。同时假设Vt,Wt,σt,Ωt相互独立。为使模型更直观,考虑N=2的情况:
观察可得,两个标的实际波动率的相关性大小既取决于共同因子的大小,也取决于各自在该共同因子上的荷载。实际波动率本身的大小则取决于共同因子的大小、荷载以及独立成分的大小。
Andersen 2001b考察了30只DJIA成分股间共435个配对的波动率相关性。435组配对中,相关性均值为20.6%,标准差为17.2%,25分位和75分位分别为8.1%和32.1%。这说明不同股票的波动率相关性总体比外汇间的低很多。
外汇市场波动率和相关系数的相关性在28%左右;股票市场多数在13%±15%区间内。
“风险”一词不光指每个标的波动多少,也指各个标的间的相关性。相关性越高,意味着资产组合分散风险的作用越差。在市场出现恐慌情绪时,不仅单个品种的波动率会飙升,品种间的相关性亦应该大幅提高,在统计上的表现就是单品种波动率和品种间相关性同涨同跌的趋势很强。
Andersen 2001a发现DM/$和Yen/$的相关性和两个外汇的波动率均呈正相关。其中,相关性和DM/$的日标准差相关性为38.5%,和Yen/$的日标准差相关性为28.3%。Andersen 2001b在股票市场上也发现了类似的正相关,但是总体幅度要低很多。在30个标的上,共可以构建870组(相关性,日标准差)的配对。这870组配对的相关性分布均值为13%,标准差为14.8%,25和75分位数为3.2%和23.6%。这表明股票市场上品种间相关性和单品种波动率的趋同性相对较弱。
波动率的时序特征
波动率的聚集效应是指波动率本身而非波动率的变化。波动率最负盛名的特质即聚集效应:今日波动率若高于均值意味着明日波动率也更可能在均值之上。两篇文章均为此提供了实证证据:Andersen 2001a发现两个品种各自的log日标准差波动率和相关性的ACF均在前5个lag明显高于40%;Andersen 2001b 也在DJIA成分股上有类似的发现。不过,我们认为“波动率的聚集效应”一词含义应被进一步明确。“聚集效应”本身指的是波动率本身的自相关性,而非波动率变化的自相关性。想象我们计算标的价格的自相关性而非标的收益的自相关性,我们会发现标的价格的“聚集效应”也很强,很难说这个结论有什么指导意义。“波动率的聚集效应”给我们的启示是波动率不会跳变。在某种程度上,这是不言自明的。
波动率的长记忆性:ACF呈二次幂而非指数次幂衰减。
波动率的另一个广为人知但在实践中常被忽略的特质是其长记忆性。从上一节DM/$和Yen/$的ACF图像中可以看出,即使到了50个lag左右,自相关性仍然接近20%。这种长记忆性是无法被单纯的AR结构捕捉的。考虑经典的AR(1)模型,即:
即自相关函数随着lag步数指数衰减。这显然和图像表现的长记忆性不符。Andersen 2001b对30只股票的log std波动率做了前22个lag的Ljung-Box Test,结果发现所有ACF(22)均和0有统计显著的差别。查阅ABDL(2001a)发现,所有股票的ACF(22)均在10%以上,这也印证了波动率的长记忆性是个普遍现象。
一种能解释长记忆性的模型是Fractionally Integrated Models(Fractionally Integrated Models)。Andersen et al.还发现波动率的一些其他特质符合该模型的预言,我们会在后文提到。
需要注意的是,尽管波动率的lagged auto-correlation具有长记忆性,但是波动率间的lagged cross correlation不具有。这意味着多因子波动率模型中共有因子不应有长记忆性。
涨跌对未来波动率变化几乎没有影响。权益市场参与者普遍认为“上涨降波,下跌升波”。这在实证上有证据支持吗?Andersen 2001b调查了当日股票涨跌和次日实际波率变化的关系,发现两者相关性几乎为零,且从散点图上找不到明显关系。我们会在后文考察两者的同步关系。
Fractionally Integrated Model的预言
这会使得当前项直接受到所有过去项的影响(即与PACF在所有lag上均不为0),这和经典的ARIMA模型形成鲜明对比。也正是因此,其自相关性随着lag增大衰减会更慢。
除了长记忆性,一些其他实证证据也符合Fractionally Integrated Model的预言,例如:
这类模型是“自相似”的,即任何一个Partial Sum也符合Fractional Integration Degree = d的同类模型。Andersen 2001a 对5天、10天、15天、20天的聚合实际波动率做了谱分析,发现由此估算所得的d和由1日波动率估算所得十分相似,都在0.4附近。
这类模型中Partial Sum的方差会随着覆盖的lag数量h呈h(2d+1)速度增长,而聚合波动率的方差和这一结果惊人地吻合,拟合效果见下图:
波动率的d似乎有普遍性:Andersen 2001b发现30只股票日度log标准差时序各自的d均值为0.377,标准差仅0.038,这和外汇市场上d =0.4上下基本一致。(作者单位:浙商期货)
期货日报网声明:任何单位和个人,凡在互联网上以商业目的传播《期货日报》社有限公司所属系列媒体相关内容的,必须事先获得《期货日报》社有限公司书面授权,方可使用。
扫描二维码添加《期货日报》官方微信公众号(qhrb168)。提供市场新闻、品种知识干货、高手故事及实盘经验分享……每日发布,全年不休。
关于我们| 广告服务| 发行业务| 联系我们| 版权声明| 合作伙伴| 网站地图
本网站提供之资料或信息,仅供投资者参考,不构成投资建议。
豫公网安备 41010702002005号, 豫ICP备13022189号-1
《期货日报》社有限公司版权所有,未经书面授权禁止使用, Copyright © www.qhrb.com.cn All Rights Reserved 。