您所在的位置: 首页>正文
可在研究思路选择和模型合理性判断上提供助力
我国市场的实际波动率初探:实证实验设计
思路设计
回顾两篇经典文献,我们收获以下重要思路:
一是波动率的单变量分布基本呈log-normal,但是这在很大程度上是凸变换的结果。每个标的波动率贴合log-normal的程度不同,程度越差的厚尾现象越明显,高波动偏离均值的幅度越大,可能的交易机会越丰富。
二是日收益率在经过波动率归一化处理后大致呈正态分布。这可能对因子归一化有指导意义。
三是波动率间相关性是存在的,但不同市场上该相关程度不同,同一市场上不同标的配对间的波动率相关性水平亦不同。这种结构值得探索,因为它能帮助波动率交易者较好地分散风险。
四是波动率和品种间相关性亦存在正相关,但不同市场的正相关幅度不同。这种相关性是市场“脆弱程度”的指标,即极端行情来临时分散风险会在多大程度上失效。
五是时序层面,波动率的聚集性不一定对交易有指导意义,但其长记忆性能对建模提出有效指导。另外,对于其均值回归特性,由于均值难以估算,我们回顾的两篇文献均未做探讨。
我们认为上述每一点都对实际交易有帮助,因此我们将在国内期货市场上围绕这五点展开实证研究。在开展实证研究之前,我们需要确定重点关注的品种和交易对,以便在全局分析之上突出局部重点,解决市场参与者真正关心的问题。
重点品种和交易对筛选
单个品种上,我们着重关注市场关注度高、交易便捷且交易机会较多的品种。我们做如下筛选:一是对所有有期权的品种,统计其2020年以来日均期权成交额,从大到小排序并取前10名。这一步能筛选出期权市场关注度高的品种。二是对所有品种统计2010年以来单日年化RV的均值,按照黑色、有色、化工、农产品、软商品、贵金属六个板块分类,每个板块从大到小排序并取前2名。这一步能筛选出各个板块内交易机会较多的品种。单日年化RV的构造方法是将每日5分钟的log收益取平方和,再年化、取平方根。
交易对上,我们既要看相关性高的品种,也要看相关性低的品种,还要看常见的套利组合。我们计算所有交易对自2010年以来的相关性,分板块排序,选取每个板块中相关性特别高和特别低的品种,并将常见的套利组合纳入其中。为减少计算量,我们采用了2010年以来4h bar计算相关性。4h bar将期货每个交易时间段自然切割。
从品种筛选结果来看:
2020年以来所有商品期权品种日均成交额如下图。排名前十的品种包括黑色系的RB、I,化工中的SC、TA,有色中的CU,贵金属中的AG、AU,农产品中的P、M和软商品中的CF,总体上看在板块间分布均匀。总成交额上看,排名第一的SC期权日均成交2亿元,排名第二的TA期权日均成交1.8亿元。近年来我国商品市场蓬勃发展,TA期权在2023年4月13日成交额已超3.1亿元,相较统计的日均已有大幅提高。
表为2020年1月1日起各品种日均期权成交额统计(单位:元)
从波动率大小上看,前10名以化工中的油品、芳烃和黑色中的炉料为主;后10名包括有色中的CU、AL,贵金属中的AU,农产品中的作物和菜油以及国债期货。
表为各种RV排序
结合两张表格,排除相关性特别高的品种,我们共选出以下重点关注对象:黑色中的RB、I、J、SA,化工中的SC、LU、PG、TA,有色中的CU、AL,贵金属中的AG、AU,软商品CF,共15个。
从交易对筛选结果来看:
我们在当前70余个期货品种(包括金融期货)中挑出活跃品种53个,计算共1378(53×52/2=1378)个配对的相关性。结果发现,所有交易对的相关性有如下分布:均值21.7%,标准差16.5%。25分位10.8%,中位数19.8%,75分位数30.8%。这给我们分板块筛选相关性高、低的交易对提供了评判标准。
黑色板块中,炉料-成材产业链的相关性普遍高于50%,而不锈钢、工业硅与剩余的品种相关性普遍低于30%。不出意外的,J-JM相关性高达81.44%,RB-HC相关性高达91.84%。铁矿石与其他品种相关性基本不高于70%。有色板块中,NI和其余品种的相关性较低,在40%左右;CU和AL相关性为55.25%,在同板块中不高,和ZN相关性为68.80%,相对较高。总的来说,黑色、有色板块的相关性多数在50%以上,总体上较高。
化工板块中低相关交易对出现得更频繁:例如SP、SA、FG、NR和其他品种相关性普遍在20%左右。剩余品种间相关性多数在30%~60%,相对较高。农产品(包括软商品)是相关性最低的一个板块,普遍在5%~20%。
最终,我们选取了以下交易对做重点关注,其中包含几组相对不常见的:V-FG因两者需求都受地产影响;V-SA的相关性比V-FG更高,因此也加入其中。SA-SC本身关系不大,作为化工板块相关性较低的配对入选。AP-CF入选是因为相关性仅15%,且两者在近两年都出过单边行情,均受到过市场高度关注。
RV的实证结果
RV单变量分布
第一,RV大多呈对数正态分布;股指、BU、PF的RV厚尾现象明显。
下表统计了RV的一至四阶矩和logRV的三阶、四阶矩(四阶矩为0表示厚尾程度和标准正态分布一致)。对比不难发现,在log变化之下三阶矩基本降为0,即logRV基本围绕均值对称;四阶矩也多数与0非常接近,说明多数品种的RV在log变化下厚尾基本消失。注意到仍有品种的logRV四阶矩绝对值在1以上:化工中的BU、PF,农产品中的AP、SR,黑色中SS,金融中的IF、IC、IH和2年期国债期货。注意到logRV峰度高的品种RV的偏度也高,这说明厚尾是由高波动造成的。一个简单的启示是,高峰度品种的高波动偏离均值幅度会比其他品种更大,在做压力测试时波动率的压力值应该对应更大的z-score。
令人意外的是,RV均值较高的SC、FU的logRV峰度并不高。这可能意味着原油波动尽管较大,但在极端情况下波动上升的幅度比较有限。在做压力测试时推荐基于基本面判断选择点位。
表为logRV大致遵循正态分布
第二,相关性高的品种对的价差仍会走出单边行情,但单边幅度和相关性并非单调关系。
重点交易对的日相关性分布数据如下(每日的相关性由5分钟log-return数据计算所得)。有意思的是,两个品种间相关性越高,这种关系往往越稳定:将每个交易对的日相关性均值除以标准差,发现所得的结果排序和相关性均值大小排序基本一致。同时我们还发现,相关性均值越高的交易对越左偏,其厚尾现象也越严重。
从交易角度理解,上述特质揭示了不同策略的风险点。高相关性的品种常被用作统计套利——从相关性均值远大于标准差这一角度看,这类策略有强有力的实证支持。然而,左偏、厚尾意味着在少数时间里相关性会大幅减弱,此时价差往往会走出单边行情。研究价差单边行情背后的基本面驱动因素便对风险判断十分重要。另外,注意到相关性均值/标准差和偏度的关系并不严格单调,这意味着有些交易对拿来做统计套利可能具有更高的性价比。
低相关性的品种常用来被分散风险,经典的CTA策略便要求多个相关性低的品种。然而,低相关性均值的交易对往往具有高相关性标准差,这意味着分散风险的效果可能在部分市场环境下大幅变差。以LH-M为例,尽管相关性均值仅有4%,但观察时序图会发现50%以上的正相关性和-50%以上的负相关性并不罕见。JD-LH、FG-V的情形类似。这告诉我们在选择低相关性品种时不应只关注总体相关性,更应该关注相关性的时序变动。
表为相关性分布验证
第三,日收益经过RV归一化后大致呈正态分布,说明收益的肥尾是异方差造成的。
参考Andersen 2001b,我们对每个标的日收益用当日RV归一化(此处RV为当日5分钟收益平方和的标准差,不经过年化)并考察其分布。结果发现,大部分品种的归一化日收益偏度基本为0,左右对称;峰度最大值不超过-0.074,肥尾现象消失殆尽。这说明收益的肥尾主要是异方差性质造成的——对波动率的波动有把握就能对极端风险有所控制。
当然,也要注意到归一化收益本身的可预测性不高:均值/标准差和最高也仅11%;归一化日收益的95%概率区间大致都在-2~2。我们能做到的就是对波动率做好预测,再根据2个z-score去推算收益率的压力值。
表为归一化后日收益(日收益/单日RV)的分布
RV多变量特征
第一,RV间的相关性普遍比收益更高,但也存在收益正相关、波动率负相关的品种对。
品种之间不仅收益存在着相关性,波动率亦存在相关性,且波动率相关系数大多比收益相关系数更高。分析重点品种间的日收益、日波动率相关性,不难发现波动率间相关系数鲜有小于20%的,多数在30%~50%,而日收益率的相关性则多在10%~40%。股指当中这一现象尤为明显:IC-IH日收益率的相关性为70%,但波动率相关系数高达88%。如Andersen 2001a所言,这指向了相关性common-factor模型。
一个有意思问题是:收益相关性越高的品种对,波动率相关性是否也越高?我们共考察了153个品种对(153=18×17/2),发现这一规律大致成立。需要注意的是,这一现象在收益率相关性高的品种对间要更明显;在低相关性品种对间甚至会出现日收益正相关,日波动负相关的情况,例如IC-J,IH-J。从理论上说,这些品种对上用期权做套利可能会比其他品种更安全。例如,考虑多IC 空J的组合,投资者表达的观点可能是IC中的煤炭企业在产业中具有优势地位,利润上涨幅度会超过J价格上涨的幅度。投资者若希望收取时间价值,可以同时卖出 IC put 和 J call。虽然看似两腿卖权风险很大,但考虑到两腿的delta和iv上相关性都为负,实际风险会比压力测试揭示的要小很多。此类品种可能构成交易机会。
第二,高波动会削弱市场的抗风险能力,但在个别品种对上有例外。
仿效Andersen 2001b,我们将波动率高时相关性也更高的现象称之为Volatility-in-Correlation Effect。对每个重点关注的品种对,我们计算相关系数和单个品种波动率的相关性,结果发现:一是收益相关性越高的品种对总体上Volatility-In-Correlation Effect越强,但是关系并不严格单调。收益相关性本身较低的品种对上,高波动还会削弱品种间相关性,例如LH-M。这意味着低相关性品种对里,单个品种走出大行情对另一个品种影响较小;反之在高相关性品种里,单个品种走出大行情另一个品种跟随的趋势会比平时更紧。从交易角度理解,这意味着类似卷螺差这样的配对在市场出现单边行情时反而会更稳固,适合做反转;而农产品中不同产业链的配对则在单边市场里也会走单边适合做趋势。二是Volatility-in-correlation Effect的力度在两个品种上有些区别,但总体是一致的。
RV的时序特征
第一,波动率ACF1在30%~60%之间,波动率变化的ACF1在-40%左右。
下图展示了近期市场关注度较高的四个有期权的品种RV的自相关性函数(ACF)。不难发现聚集性确实存在:1个lag上,最低的豆粕RV自相关性也达到了35%,最高的I有65%,这也说明I的波动在短期内的持续性比M强。在20个lag上,AG、SC、M都在20%左右,I在40%左右,说明商品的波动持续一个月以上的概率比一个月以下要高。
图为AG RV的ACF(单位:%)
图为AG RV单月变化的ACF(单位:%)
但是,聚集性指的是波动率本身的聚集性,而非波动率变化的聚集性。波动率单日变化和上一日的变化相关性在-40%~-50%,再往前则基本不存在相关性。上面四个品种RV单日变化的自相关性函数如下。另外统计所有重点品种波动率变化的自相关性,也能得到类似的结论。
这意味从波动率交易的角度,RV高ACF并无太大用处(价格也有很高的自相关性,但没太大实际意义)。反倒是RV_change一个lag上的高负相关性体现了波动率均值回归的特征。我们接下来探索这一结构的特征。
第二,RV的向下均值回归趋势比向上的要明显得多。
这一节我们想说明两件事:一是RV均值回归的特质十分明显,且向下回归的趋势比向上回归要强得多。下表统计了RV次日变化和当日RV-HV30的相关性,发现对所有重点关注品种,相关性均超过-40%。将数据进一步拆解成当日RV>HV30和RV<HV30,发现当RV>HV30时,次日RV变化和当日RV-HV30的相关性均在-50%以上;但当RV<HV30时,相关性下降到-15%到-20%之间。通俗地说,高波动的不可持续性比低波动要强得多。
二是这和上一节提到的明日RV变化和今日RV变化呈负相关不是同一件事。我们考察当日RV变化和当日RV-HV30的距离,发现两者相关性在50%左右。这说明一项指标能解释另一项指标大约25%的波动。考虑到两个指标的同时性,我们不认为他们捕捉了相同的信息。
第三,“上涨降波,下跌升波”这一现象仅在权益市场微弱存在。
权益市场普遍相信“越跌波动越大,越涨波动越小”。美股期权市场的负偏度即表达了这种观点。我国股票期权也有明显的负偏度,但由于这可能是对缺乏有效做空标的手段的补偿,我们无法草率地将其和“越跌波动越大,越涨波动越小的”观点等同起来,“上涨降波,下跌升波”这个观点有实证证据吗?
我们考察了3个期权成交额较大的商品品种(SC、I、P)和上市时间较长的IH、IF、IC三个股指期货,分别计算了当日标的涨跌幅和波动率变化的相关性,结果发现商品市场上波动率变化和收益相关性几乎为0。权益市场上确实存在着“上涨降波,下跌升波”的现象,但相关性基本在-15%左右,并不强。我们还按照当日收益正负号,分别绘制了单日波动率涨跌的分布,结果发现即使是在权益市场上两者差异也并不明显。因此我们认为至少从实际波动率角度,“上涨降波,下跌升波”这一现象仅微弱存在。
总结
参考两篇经典文献的思路,我们得到如下实证结果:
单变量地看
RV大多呈对数正态分布。BU、PF、SS、AP、SR和股指的logRV厚尾现象明显。这意味着这些品种高波动偏离均值的幅度超过其他品种。交易中须重点关注这些品种的尾部风险。
低相关性品种对的日内相关性基本呈正态分布,但是该分布的标准差远大于均值。从时序图上看,相关性均值回归特征明显。这提醒我们在配置低相关性品种时,应根据配置时长做好相关性预测,以准确衡量组合风险。
高相关性品种对的日内相关性紧密围绕均值分布,这意味着相关性结构非常稳定。但是这些分布也有明显的左偏现象,且左偏幅度和相关系数并非单调关系。这意味着有些品种对做统计套利会比其他性价比更高。
大多品种用RV归一化的日频收益呈标准正态分布(均值接近0,标准差接近1)。这意味着收益的肥尾基本都来自波动率的变化,也给这一通用模型提供了实证依据。通俗地说,如果我们能完美预测波动率,那给定任何一个阈值,我们都能几乎完美地测算标的在这个阈值上的VaR。实操里如果想获得收益95%的概率区间,不妨以2倍预测所得的RV做参考。
多变量地看
不同品种间RV的相关性总体比return要更高,这指向了common factor volatility model。一般来讲,return相关性越高的品种对,RV相关性也越高,但存在例外,比如IH-J,return相关性为21%,波动率相关性为-14%。在这些品种对上做交叉双卖也许风险并没有那么大。
总体上讲,高波动的确会削弱市场分散风险的能力,但不能一概而论。例如当LH波动率升高时,LH-M间的相关性反而会下降。关注波动率和相关性的影响可以让我们识别每个价差对应该做趋势还是做反转:如果高波动时相关性升高,应该做反转;不然应该做趋势。
从时序上看
波动率ACF1在30%~60%之间,且ACF具有长记忆特质;波动率变化的ACF1在-40%左右,会快速衰减。
波动率的均值回归特性明显,且向下回归比向上回归的概率要大得多。Corr(next_RV_chg,RV-HV30| RV-HV30>0)在-50%左右,而Corr(next_RV_chg, RV-HV30|RV-HV30<0)在-15%到-20%之间。另外,RV距离移动均值的距离和RV今日变化之间相关性为50%,两者捕捉到了不同的信息。
“上涨降波,下跌升波”只在权益市场微弱存在。IH、IF、IC单日收益和波动率单日变化的相关性在-10%~-20%之间。至少从实际波动率来看,不应迷信这一现象。
总得来说,本文对波动率的一些统计性质做了定量的、相对全面的回顾,希望本文中的实证成果能为未来的研究抛砖引玉,使期权和波动率更好地被市场理解、运用。(作者单位:浙商期货)
期货日报网声明:任何单位和个人,凡在互联网上以商业目的传播《期货日报》社有限公司所属系列媒体相关内容的,必须事先获得《期货日报》社有限公司书面授权,方可使用。
扫描二维码添加《期货日报》官方微信公众号(qhrb168)。提供市场新闻、品种知识干货、高手故事及实盘经验分享……每日发布,全年不休。
关于我们| 广告服务| 发行业务| 联系我们| 版权声明| 合作伙伴| 网站地图
本网站提供之资料或信息,仅供投资者参考,不构成投资建议。
豫公网安备 41010702002005号, 豫ICP备13022189号-1
《期货日报》社有限公司版权所有,未经书面授权禁止使用, Copyright © www.qhrb.com.cn All Rights Reserved 。