套利机制的存在能使价格偏离逐渐恢复至均衡水平
引言
统计套利最早由Bondarenko(2003)提出,是一种基于量化模型的投资过程,将套利建立在对历史数据进行统计分析的基础之上,估计相关变量的概率分布,并结合基本面数据进行分析,旨在风险有限的情况下,得到最高收益的套利交易。相比于无风险套利,统计套利少量增加了一些风险,同时增加了取得收益的机会。
本文通过对沪深300股指期货和上证50股指期货的历史数据进行分析,发现两者都是非平稳时间序列数据。同时,利用协整检验,发现两者具有长期均衡的协整关系,在确定交易组合的长期稳定性关系后,提出相应的修正模型,并利用这一稳定性关系的系数作为比例构建投资组合。
统计套利的基本概念
统计套利是一种基于量化模型的投资过程,是在不依赖经济含义的情况下,运用数量手段构建资产组合,根据证券实际价格与数量模型所预测的理论价值进行对比,构建证券投资组合的多头和空头,从而对市场风险进行规避,获取稳定的Alpha值。
统计套利这一概念最早由Bondarenko(2003)提出,Hogan(2004)在其基础上利用统计套利的思想研究市场效率,利用更加精确的公式化的统计套利,在数学上精确了统计套利的范围,并被广泛应用。
设初始投入为零的自融资交易策略X(t):t0,在t时刻经无风险利率折现后的价值为v(t),如果v(t)满足以下条件,则称该交易策略为一个统计套利机会。
上述表明,统计套利需要满足的四个条件:一是自融资交易策略的初始投资为零;二是期望收益为正;三是时间越长,损失概率越趋于零;四是如果在任意时间内发生亏损的概率大于零,那么其收益的平均方差趋于零。
值得注意的是,第四个条件当且仅当损失概率大于零时成立,则表明统计套利是有风险的,即存在损失的可能。因此,统计套利在一段时间内并不是无风险套利,这也是普通套利和统计套利之间差别的体现。如果在某一时刻T,当t>T时,有P[v(t)<0 ]=0,则被视为普通标准套利。
有别于无风险套利,统计套利是利用证券价格的历史统计规律进行套利,是一种风险套利,其风险在于这种历史统计规律在未来一段时间内是否继续存在。由于期货价格在到期时必须收敛于现货价格,基差必然归零,所以期现套利可以看作是无风险套利。然而,由于指数标的股不同,相同月份、不同标的期货合约的价格并不一定收敛。因此,跨品种套利实际上是一种风险套利或者是统计套利。
统计套利在方法上可以分为两类:一类是利用价格序列的协整关系建模,称之为协整策略;另一类是利用收益率序列建模,目标是在组合的β值等于零的前提下实现Alpha收益,称之为β中性策略,该策略主要应用于融资融券的套利交易中。
股指期货联动性分析
传统的时间序列模型一般只能描述平稳时间序列的变化规律,而通过观察沪深300股指期货和上证50股指期货的历史数据可知,其历史数据是非平稳的。
对于非平稳数据,Engle and Granger(1987)提出协整理论及其方法来处理,因为虽然数据本身可能是非平稳的,但是两个数据的线性组合却可能是平稳序列。如果两个数据之间具有长期稳定的关系,就称之为协整,所以两个数据长期处于均值回复,不可能一直出现无限制偏离,这为两个标的之间进行套利提供了可能性。
通过观察沪深300股指期货和上证50股指期货每分钟走势,我们可以发现,两者价格走势均是非平稳的,其价格并不一定回归到均值,但是两者相互之间的走势趋同,具有一定的一致性和同步性。因此,可以利用协整检验寻找两者之间的关系。
协整性分析通常分为以下三个步骤:
一是对序列进行单位根检验。只有时间序列数据Xt和Yt在都是同阶单整时,即Xt~I(d)和Yt~I(d),才可能存在协整关系。
二是对这两个同阶单整的序列进行协整检验,看这两个非平稳时间序列数字是否符合协整关系。
三是构建误差修正模型,研究误差范围与影响程度。
图为沪深300股指期货和上证50股指期货每分钟价格走势
图为沪深300股指期货和上证50股指期货每分钟收益率