多因子模型
相似的资产会有相似的回报,这是多因子模型的基本假设。由于某些特定的原因(因子),资产会表现的十分类似,例如价量变化、行业、规模或者利率变化。多因子模型就是为了发掘这些因子,并且确定收益率随因子变化的敏感程度。通常来说,多因子模型包括了宏观因子模型、基本面因子模型和统计因子模型。这几种模型在分析不同的大类资产风险收益的时候也有不同的效果。
实现原理
单个资产的多因子模型可以表示成:
多因子模型的价值
1. 提供了一种全面分析风险的框架
2. 大大降低了运算量。假设有 1000 种资产的组合,传统基于收益的方法需要计算 1000x1000 的协方差矩阵,而假设这里只有 50 种因子,矩阵的规模减少到了 50x50
3. 每个周期都更新数据,更好地适应变化的市场环境
4. 因子具有经济意义,可以更好地解释收益,收益可以跟踪
5. 缺点是一般只用于预测大部分风险,但是无法预测收益
权益风险模型
站在历史的角度
预测股票未来波动率的方法有很多,其中比较流行的一种就是分析历史数据,然后推测未来可能具有类似的表现。这种方法最大的问题在于,历史数据的长短,并且和测试的历史市场环境紧密相关。也就是说,随着时间的变化,股票的特性可能发生变化,比如公司的并购重组、战略转型等行为,都会造成股价的波动,过去的数据并不能预测未来。而经典的 CAPM 模型里面,就是通过这些历史数据来计算 Beta 值的。
1950 年之前,系统性、或者市场相关的收益这种概念,还未出现,直到 1950 年初 HarryMarkowitz 首先将风险定量地用标准差来表示。随着后来有学者不断完善和补充这一理论,认为市场的风险是由不可被分散的系统性风险和可以被投资组合分散的残余风险:
随着对市场认识的不断加深,一种叫做资本资产定价模型(CAPM)的理论也被提出,用来描述收益和市场风险的关系:
这个理论认为证券的预期收益正比于系统性风险系数,即 Beta。形象地说,Beta 就是描述证券组合对市场波动的敏感程度,比如 Beta= 2 时,市场上涨 10%,那么该证券就上涨 20%。
模型演变
CAPM 描述的是一种市场的平衡状态,前提假设是市场是有效的,但不要求残余收益是不相关的。威廉夏普基于对这种理论进行了延伸,提出了单因子风险模型,其实就是 CAPM 公式的一个变形,但是假设了残余收益是不相关的。
后来,学者们逐渐发现,相似的资产总是表现出一些共同的特点,后来就总结出了套利定价模型(APT),认为资产的预期收益等于一些未知的系统性因子的线性组合。APT 模型的提出是为了用来预测收益的,后来逐渐就演变成了多因子模型。
Barra 怎么做
如前文所述,基于历史数据的定价模型存在诸多不合理之处,用这样的方法计算出来的 Beta 也称为 "历史 Beta",而 Barra 基于风险模型,提出了 "预测 Beta" 的方法。Barra 所使用的风险因子主要来自于基本面,包括行业、规模、波动性等。由于这些风险因子是每月重新计算的,因此这种 "预测 Beta" 可以很好地反应公司的近期风险结构。
Barra 的模型将风险按照以下的方式进行划分:
其中,共同风险包括了风险指数,代表资产的一些共同特点,如成长 / 价值、小盘 / 大盘;也包括了不同行业的区分。特有风险是将每种资产的风险和市场风险的相对值,进行标准化处理之后得到。
权益风险模型建立过程
1. 数据获取
获取数据和处理数据是第一步,在权益风险模型中,以市场数据和基本面的数据为主,其中市场数据一般是可以每日获取的,而基本面数据一般是一个季度甚至半年以上。在这里,尤其要注意到一些数据的跳跃,如资产规模的突变,缺失的价格数据等;此外,还要尤其注意公司的特殊事件,如资产重组,这些都会导致数据的不连续。
2. 统计量(因子)筛选和测试
这是核心!因子来源很广泛,传统的方法里面主要包括了市场量价指标和基本面指标,以及它们的组合。因子的检验是很严格的,不仅需要在逻辑上有意义,同时还要经过严格的统计测试。这些因子必须是要能够预测风险,并且在时间上体现出一定的时效性,换句话说,它一定是可以给模型带来一定的预测效果的。
3. 标准化
各种因子指标的大小范围差距很大,需要标准化。方法有很多,可以通过排序,然后分布在(0,1)之间,也可以用高斯标准化的方法,因情况而定。
4. 风险指数建立
数据处理全部完毕之后,每个风险因子都要在不同行业之间回归并做统计显著性测试,检验其对收益的解释性,通过测试的因子就可以成为一个风险指数。风险指数建立的过程是一个迭代的过程,首先入选的是解释性最好的因子,此后的因子都要保证能够带来更多的解释效果,才可以入选。
5. 行业分配
不同行业的收益、风险都会表现出很大的区别,因此在模型中有必要进行这样的划分。
6. 因子收益估计
在每个时间截面上,可以通过横截面回归的方法确定因子收益,也就是回归系数。接着,在对于历史数据,对因子收益的时间序列求协方差矩阵。这里有一个很重要的问题,就是因子收益之间的相关性是在随时变化的,比如高波动性的月份可能比较集中。对此,主要有两种解决方案:
1 是通过指数加权,约近的月份获得越大的权重,而距离现在越远的月份获得越小的权重,这可以通过一个指数衰减的公式确定。
2 是通过市场指数的波动率来估计这个协方差矩阵,这里需要将因子的协方差矩阵乘上一个由市场收益率方差确定的系数。
7. 特有风险
这个风险矩阵常规来说就是通过历史方差确定,但是这里假设了收益方差是稳定的。Barra 提出了一种新的方法,可以捕获特有风险的市场平均水平,以及特有风险和资产基本面的相关关系。建立这样一种模型包括了计算特有风险的市场平均水平和资产特有风险和基本面特征的相对值。
8. 更新模型
以上的计算过程在每个时间截面都需要更新和重新计算,一般选择一个月为周期。
固定收益风险模型
发展历史
在早些年之前,投资者认为高等级债券是一种安全的工具,直到 1970 年代到 1980 年代初利率飙升,才意识到国债并不是无风险的。
传统上,债券的风险是由久期 – 即债券价格随着利率变化的敏感程度来决定的,假设债券收益率是完美相关和同等程度的波动,并且可以产生确定的现金流。不过事实上,这些假设都是不充分的。比如利率风险不仅由收益曲线的平移决定,同时也受到曲线的斜率和曲率变化影响;不同市场下的债券投资组合由不同市场利率决定;许多的固定收益证券并不 "固定",它们可能受到含权、提早还款、变化利率的影响。除此之外,债券还存在信用风险,公司债的持有人通常会暴露于信用差价的风险中,比如 1998 年那次俄罗斯政府债券违约的事件。
因此对于固定收益投资,需要建立一套风险模型,来有效地分解这些带来收益的风险因子,并且确定它们的协方差。传统的方法将固定收益风险分解成利率风险、信用差价风险、流动性风险、波动率的不确定性风险、提前还款预期风险等,高信用等级的债券主要关注利率风险,而低等级的债券则主要关注信用风险。
多因子模型
Barra 模型将固定收益风险分为共同风险和特有风险,其中共同风险包括了利率风险和信用差价风险,由利率和风险差价期限结构的波动、因子之间的相关性以及债券对于因子的暴露情况决定。上文提到的波动率、流动性、提前还款等无法被共同风险解释的那部分都归类于特有风险。
利率风险模型
对于市场上投资级债券的最大风险就是利率变动,Barra 将利率曲线的形状的变化分为平移、扭转和蝴蝶曲折。平移指的是收益曲线的整体平行移动,所有的关键利率等量的变化;扭转表示收益曲线的远期和近期发生相反方向的移动;蝴蝶曲折表示利率曲线的曲折状变化。这三个因子本质上是关键利率协方差矩阵的前三个主成分,大概可以解释 90% 到 98% 的利率变化。
利率的期限结构决定了利率风险模型,在成熟的市场中,高等级债券的收益率和政府债券很接近,因此这类债券的定价可以通过政府债的期限结构来决定。期限结构的变化也是多样化的:所有债券的期限同时增加或减少,或者是曲线的一端变化、另一端不变,这些都是导致高等级债券投资组合收益的因素。
利率风险模型需要对期限结构做一个分析和预测,预测算法的目标是寻找到一个可以最小化模型和市场价格差异的利率。Barra 模型首先通过一些限制来平滑期限结构,并且通过 LIBOR 驱动的方式来调整短期利率,然后通过分析历史期限结构变化对关键利率协方差矩阵进行主成分分析,得前三项因子,即平移、扭转和蝴蝶曲折,再通过对超额收益的因子暴露进行横截面回归,得到因子收益。这三个最重要的因子就是利率变化的正交加权组合,用来构建 3x3 的利率风险的计算基础。
利率收益风险模型建立过程
1、数据获取
获取 29 个不同市场的政府债券、4 个不同市场的通胀保护债券、美国 AAA 级免税市政债券和 23 个不同市场的 LIBOR 互换曲线的每日价格数据。
2、期限结构特别处理
利率期限结构是量化推导出来的,其数值始终在变化,我们每天都为了计算估值和因子暴露而重新估算期限结构。计算的方法包括以下两个方面:
a. 差值
利率结构曲线的是通过即期利率在不同的期限(1 年、2 年、5 年、10 年等)下的离散值绘制成的,在这些设定好的期限之间的利率值,通常通过线性差值的方法确定。这种方法假设了在不同点之间的远期利率是保持不变的。
b. 预测算法执行
用来预测期限结构的目标函数可以分为三个部分:
第一部分用于最小化市场和期限模型价格之间的差异;第二部分使期限结构趋于平滑;第三部分使用了 LIBOR 对短期期限结构进行调整。对于不同的情况下,三者的权重也会有所差异。
3、因子形状确定:关键利率协方差矩阵
从历史期限结构可以得到即期利率协方差矩阵:计算即期利率在时间序列上的月度差值,从这些时间序列中可以得到关键利率的协方差矩阵,这个矩阵的主成分或者特征值,就对应于期限结构变化的三个不相关的方向,可以解释大约 95% 的波动。
4、因子暴露计算
期限结构的因子暴露是通过数值微分的方式计算的。对于风险因子的暴露指的是债券价格对于因子变动的敏感程度,比如有效久期就是价格对于利率平移的敏感程度。
5、因子收益估计
首先确定可以解释收益的那些因子暴露值,然后通过横截面回归的方式确定这些因子的回报,这个过程和权益风险模型类似。基于债券收益的回归,不仅考虑了债券在到期时间上的不同分布情况,还随着分布的变化进行动态调整。其计算方法和权益类因子模型相近:
6、协方差矩阵及其相关性矩阵
通过主成分因子在时间序列上的回报率来计算协方差矩阵,主对角线上的元素表示年化收益的标准差,其他的元素表示因子之间的相关性。这些相关性系数涵盖了预测风险的重要信息,只要不是完全相关,那么模型就有一定的解释作用。
7、更新模型
计算最近一个月的因子暴露和回报,Barra 模型使用的是最新的市场数据。其中期限结构是基于每日数据,风险因子的协方差矩阵基于每月数据。平移、扭转和蝴蝶曲折因子的精确表达式基于预测周期、平滑方法、加权方式以及其他细节。由于关键利率矩阵变化很慢,因子的重新调整和估计不需要很频繁。
价差风险模型
在过去,国际上债券投资经理主要关注政府债券的问题,这也是全球固定收益指数的主要组成部分。近年来,越来越多人关注到了公司和机构债券、外国债券以及信用衍生品,这些债券都具有价差风险。
价差风险主要来自两部分:市场价差风险和信用事件风险。前者指的是整个市场层面的价差的变动,后者指的是某个债券发行人遭遇的事件导致价差的变动。在拥有详细信用模型的成熟的市场,信用差价风险可以分为两部分:互换差价部分和基于行业评级的信用差价部分。
互换差价风险模型
在信用价差模型或者新兴市场模型未被使用的市场,信用价差风险通常被互换价差代替。下图是美国 BBB 债券的信用价差的走势图:
1998 年的金融危机导致了波动率突然增大,从而导致了一些列的高波动率。这种类型的风险可以通过价差因子进行建模分析。
互换差价风险模型建立过程
1、数据获取
Barra 从 26 个不同的市场获取每日互换利率的数据,在每个市场,互换差价风险是基于一个单独的因子:互换利率曲线和国库券收益率曲线的月均变化。
2、因子暴露计算
对暴露于除互换价差风险之外的信用因子和新兴市场因子的债券而言,互换差价的暴露等于债券回报对互换价差变化的敏感性。对没有别的因子可以解释其信用风险的债券而言,互换价差因子可以用来预测信用质量多变的债务的风险。由于低等级债券波动更大,Barra 通过期权调整价差(OAS)来缩放互换价差的暴露值。用公式可以这么表示:
信用价差风险模型
在目前最活跃的四个市场,即美元区、欧元区、英镑区和日元区,信用价差风险可以分解成为互换价差风险和信用价差超越互换差价风险的部分。债券信用价差具有货币相关性,比如同一家公司在不同国家发行的债券,对于价差变化并没有显著相关。下图是不同市场的价差波动率的比较:
信用价差风险模型建立过程
1、数据获取
从美元、日元、欧元和英镑四个市场获取债券价格、期限、评级的每日数据。
2、因子暴露
某种信用工具对应的货币、行业和评级的因子暴露是价差久期。
数学上表示为:
3、因子回报
每月的信用价差因子回报是在行业评级分类下的债券价差的加权平均值。如果每一类当中的债券数量不到最小要求,一般可以将相同等级债券进行聚合。
4、协方差矩阵
风险因子的协方差矩阵基于因子历史回报,信用因子协方差根据不同市场而异,Barra 模型将美元、英镑、欧元和日元进行了单独分别的计算。
来源: http://www.sigmaschina.com/h-nd-846.html