股市是一类超生命体,用复杂系统的思维理解更接近事实,风控择时的着手点也应如此的。系统运行的真相常常违反投资者直觉,因投资者注意力经常集中在局部,有意或无意地忽略了系统的较多相关细节(统计偏差,认知偏差,选择性偏差等特征),但又常常依赖于这些本不全面的先验知识;系统的结果已经形成,但背后的诱导因素很难全面地分析,反身性特征常有:投资者思维与股市相互联系与影响,彼此无法独立,认知与投资处于永远的变化之中。
用复杂系统(网络)建模股市的话,具有较为复杂的特征:
1)节点很难描述清楚:特征多、信息有损、有增减、数据不透明,无法做到完备;
2)边很难准确构建:点点之间的相互关系很重要,很多功能都是对应于子网络结构,但依赖程度、时滞,网络构建准确性不够;
3)外部输入有随机性:边界变化带来了更多的不确定,输入后对原系统影响的模式不清晰(节、边的变化);
4)演化路径/反馈结果难预测:一定边界限制下的演变难预知(成长路径、演化方向、混沌程度、分叉现象等)。
股市系统是长程相关的,长尾的,幂率分布现象随处可见,很多看似小概率的事件其实是必然会发生的;相互独立的假设在金融中极端情况可能会造成非常严重的后果,虽然均值回归是常态,但在系统论的角度黑天鹅也是一种常态:次贷危机、LTCM倒闭都源于此。
事件之间的关联性:美国次贷危机,就是假设低评级次级贷款相互之间没有关联(贷款人的年龄、职业、所在地等等都不一样,同时违约的可能性很小),将CCC评级的次贷打包成为一个AA的资产,但倾巢之下安有完卵,随着经济走差、失业率提高,底特律的汽车工人和迈阿密的餐馆服务生很可能同时发生违约。我们称之为股市里的级联效应。
投资中其实有很多“必然性事件”:长期资本管理公司致力于通过严密的模型以及科学的计算获得稳定超额收益,在1994、1995、1996收益分别20%、43%、41%,期间几乎没有回撤;但在1998年还是倒闭了,遇到了俄罗斯金融危机(发生概率137亿分之一,从宇宙形成那一刻,都不应该发生)小概率事件的发生成了毁灭性打击。
小概率事件(正态分布)发生的概率比我们想象的更大,肥尾效应才是经济系统中最常见的现象;可怕的是Black-Scholes期权定价模型、VaR风险定价模型中都有基于正态分布模型的假设。
股票的收益率并不是服从正态分布的,理论上出现的次数和实际并不相符合,道琼斯指数涨幅超过2.56%或者跌幅超过2.48%的交易日出现了222次,单日涨幅超过5.10%或跌幅超过5.02%发生次数理论上应该是0,但实际发生的次数居然有23次;实际极端涨跌幅出现的概率比理论计算更大。
一、风控择时的困境
风险常见且无法预测,很多投资人放弃了风控择时,造成产品净值大幅波动;或者被动应对以对冲工具,大幅度降低了收益率。
我们坚定地在风控为王的道路上探索量化择时风控,并取得了一些可供分享交流讨论的进展。
股市波动是始终存在的,同时也是无法被预测到,任何股票都不可能只涨不跌,也没有投资者可以做到精准躲避掉股价波动中的所有下跌。
波动是股票交易者在时间、空间上的错位造成的,短期股价的波动遵循的是几何布朗运动,可能永远无法预测短期股价的走势。
但是我们可以从以下几个角度进行应对:
1、【风控角度】:风险平衡/反脆弱性(金三角/风险评价/攻守平衡)。
宏观风控择时与微观结构选择不匹配,宏观系统风险出现,但依然可能有结构可以参与。
顶部拐点是结构和总量的调整,择时既是风控,也为结构调整作准备,调整后的市场很多优秀的行业、龙头公司出现了买入机会。
复杂网络中的结构选择、涌现发掘、反馈机制应是解决宏观与微观错位的较优方案,在复杂网络中选择长期稳定的结构,了解结构的变迁,评估最重要的子网络,抓住主要矛盾和变迁机制。
个体识别风险相对主观,取决于认知范围、承受能力、管理模式,多头风险是系统性下跌(择时),指数增强或者对冲是选错(结构性),量化高频的风险是市场缺乏波动(流动性),杠杆资金是能否生存下来(存续),并不在同一个维度,个体的约束边界不同,考虑的风险是不同的。客观的系统风险的认知需要跳出个体视角,个体认知偏低维,相对于系统的成长路径难以存活(即:散户尤为突出,在时代浪潮中迷失的概率较大)。
投资组合的权重优化,本质上是对多种不同因子之间的权衡考量,是对结构优劣的衡量,是一种效率的构建,最佳的方式是适应系统的最佳方向:即要选对赛道,又要相对重仓较优赛道,
在已获得的边界约束条件下配置的最佳方案就是最大熵分布,依靠机器学习做权重的最佳分配,按照大概率原则做决策。
2、【风控角度】触发机制:与市场的偏离、与行业结构的偏离、与同行的偏离、与自己的偏离(年化收益率),考察所有偏离平衡的极值
对股票来说,时间是价值的刻度。投资决策是某一时点做出来的,但系统却是动态演化的,但随着时间推进,经验分布不断更新,与决策初期的分布出现偏离(不同时间上经验分布的互信息扩大)。
价值投资并不是买入永远持有不动,而是要持续跟踪信息变化,是否与买入时期的逻辑有较大偏离。坚持做时间的朋友,不仅要看待长期的空间,也需要观察边界约束的变化,分布偏离的大小决定短期交易方向与长期时间价值是否一致。
3、【风控角度】情景分析、动态跟踪、事件分析,人机结合;风险收益比动态评估。
投资者结合其自身的经历以及过往的经验,对当时时点接收到的所有信息综合分析后,输出对未来股价以及市场走势的判断。但现实情况是复杂的,任何两个时点的市场环境都不可能完全相同,用过往经验做判断,结果可能和预期大相径庭。
历史规律失效,可以映射到过拟合现象,比如趋势和均值回归,逐步接近历史极值如何选择?超越历史极值如何选择?此时判断的依据应该是约束条件的变化(外部约束,先验知识),做大概率的事情,制定好纠错机制,即风控。
股市风险的两类典型释放方式:1)A股过往两轮牛市破灭后的惨烈普跌,持续时间长;A股情绪的全面高潮意味着全面风险,过去两轮大牛市最后都以惨烈收场,原因恰恰在于普涨;牛短熊长最核心的原因,就在于牛市普涨,资金能量无法长期持续,容易崩塌,普涨很快结束。2)另一个市场特征的美股过去十年的快速急跌快速修复的方式,下跌时间短跌速快。核心资产的持续慢牛,估值可能先领先于盈利持续扩张,但优质公司的高估值有可能通过时间和成长性消化,市场资金使用效率也最高,风险的释放反而是短促的。
系统中的超级节点是稀缺性,体现出幂律分布特点,具有一定的反脆弱性和鲁棒性:股市网络中超级节点的估值扩张,不断被市场强化,形成幂率分布状态,结构性牛市,是最节约流动性的方式,持续性较强。
但是股市超级节点的灰犀牛问题,就是所谓核心资产的“抱团”现象,泡沫会持续到什么程度,应该就在熵能竞争出现乖离的时候,流动性输入、风险偏好强度、基本面内生变化无法支持系统熵增的跨越,这是一个持续的过程,是一个量变引起质变的过程。
4、【风控角度】边界约束条件的丰富,压缩感知找到主要变量,先加法再减法,寻找不同市场涨跌的驱动因素。
抓住主要矛盾,寻找最大熵方向,就是投资的关键。
我们设计量化风控框架遵循的原则:
1、风控的认知角度是总量+分布的角度,即市场/持仓(择时、结构)分析,尽量多的寻找市场约束条件。指标包括:量化流动性(债券、利率、杠杆、资金进出)、金融行为(拥挤度、融资情绪、风险偏好)、经济基本面等,也要落实到结构比较上(估值分化度,交易额占比等)。
2、考察持续的过程,准确的市场顶/底难以预测。风险和机会均是一个不断积累的过程,应该是量变引起质变的过程,我们可以通过总量/结构的偏差(与市场、仓位、结构、行业)、极值、异常等指标,提前看到并讨论风险的累积程度,一旦系统的总量和结构出现异常,需要警惕风险。
风控机制的构建思路:
1、风控触发时机:通过量化指标、约束条件的变化计量。
全方位做到事前、事中、事后风控过程管理:事前生成全面的风险提示单,全面掌握市场动态,量化合理仓位;事中监控持仓个股/行业/市场的风险收益比、异常波动,做动态反馈与组合调整;事后进行组合归因分析,配置效率评估(结构、权重、走势),获得风控信号集,反馈于投研、决策。
量化合规、基本面、技术面等角度的特征集,全面理解市场、组合及个股风险,从仓位与市场偏离、净值回撤、相对市场偏离、行业偏离等方面,暴露风险并提出风控预警,及时修正偏离度。
开放进化风控,是一个开放的系统,坚持以市场为中心,紧跟市场,动态调整,善于发现新的风控点及指标,不固化、持续创新,不断完善;复杂的市场变化又快,中长期看风控体系应该具备自我学习、自我进化的人工智能能力。
高效性落实量化风控的关键在于简单且高效:所有的风险评估均落实到风险收益比角度,直观反映我们当前所处的风险;搭建风控信息化平台(数据维护、算法引擎、回测平台、组合管理、风控触发),高效解决新风控问题,抽象新的风控指标,可视化风控要素,有助于扩展风控因子,加速风控体系的进化。
偏差、极值:净值回撤、仓位与市场偏差、结构/行业偏差。
异常:市场情绪;龙头行业表现;资金进出;同业操作;外围市场。
2、反馈机制:明确风控意见,仓位规划、结构优化,确定主要矛盾和跟踪变量,明确当前理解市场的主逻辑,行业比较、权重优化、风险均衡。
3、量化跟踪,排除情绪变化,及时观察、反馈指标变化,做好容错和纠错准备。
形成连续思维,投资逻辑先假定,跟踪约束条件的变化(贝叶斯);策略应对要容错,要有纠错机制。
风控的终极目标是避免不确定的风险,追求高确定性的收益机会,控制回撤,最大化复利效应;不能全面掌握系统,至少有模糊的正确,映射到风险收益比,通过仓位的增减建议落实交易决策择时,做市场特征的发掘。
Machinelearning把逻辑和概率统一起来:机(大数据),人(常识、逻辑),输出(概率);现在复杂系统中的问题越来越归到计算中来:人提供了很多情景假设,很多语义分析,给予一定的约束条件,降低搜索空间。
偏差的及时发现:绝对回撤、相对回撤、行业绝对和相对回撤、持仓估值分位数,指标和程序首先设计好,然后可以再优化。
偏差、异常、极值的发现具有现实的风控意义,及时发现组合与当前市场个股、行业、风格、因子表现的差异,是否站在最大熵约束下,如果出现较大的差别,持仓并没有抓住市场的表现,就需要及时纠正(风控的必要性)。
合熵:基本面分析提供了系统内部的能量供给结构,还需要叠加市场层面的量化发现,贴近市场,一定要和市场做一个匹配;股市是两个分层网络,基本面锁定趋势,市场面锁定效率,两个最大熵结合,会离市场更近一点。
回撤:收益损失、净值下跌就是最直观的大风险。竞争市场中还要考虑净值相对差距,即使净值不跌但被市场拉出大差距也是更大的风险。与系统内部的竞争者处于劣势,进化中如果长期劣势状态,有被淘汰的风险。我们在市场下跌时,要尽量少跌,以择时能力强、结构有优势,跟随市场方向下注,跟随最大熵方向,沿着阻力最小的方向做选择。
异常/极值的识别:结合基本面、情绪面、资金面;泡沫程度、拥挤程度、资金进出趋势等。指标选择原则一方面简单有效、数据易得;另一方面尽量全面客观。选取以下:
1)总量(流动性):流动性是系统的外界能力,和基本面组成了系统的能,与系统熵增的匹配是流动性评估,判断增量或存量市场。
①股债溢价:EYBY;
②超额流动性指标;
③熵能(行业相对熵/交易额):负熵提供与系统所需能量的匹配度;
④资金流进流出;
2)结构:行业、结构风控比较的重要性:随机->分步-迭代->推广:随机配置一些行业/个股,等待形成正反馈,逐渐加重仓位;生成对抗的方式选组合:适应系统的才是最好的,不断更新。
①估值分化指数;
②交易额集中度(5%);
③行业相对熵;
④相对位置(换手率,股价,估值);
3)市场情绪方面:风险偏好是趋势的放大器,抱团现象,群氓现象、羊群效应皆因如此;系统趋势中,决定了资金流向哪些赛道,持续得程度,是衡量市场风险非常重要的一类指标。
①均线强弱指数;
②融资情绪;
③风险偏好;
④年化收益率;
⑤换手率合熵;
⑥信息扩散度;
4)落实到风险收益比角度[1]:概率思维,过度幂率、偏离平衡态是不行的,空间上有安全性(做到高位谨慎,底位乐观),时间上大概率能获胜。降低复杂度,通过仓位变动应对时间进程上的波动,15%、45%、75%:一直涨不行,下跌会是过度的,趋势过后回调一下、平衡一下,寻找新的力量,才是稳定的。
缺点:
(1)容易钝化,可能需要耐心等待6-12个月。
(2)从历史结果来看,极值点似乎存在一些趋势性上移的迹象(比如ERP底部极值点是上行抬升的)。
(3)A股未来还是否会像过去那样有大的波动周期,还是维持在一个合理区间震荡(像美股那样,估值不是太高也不是太低)需要观察。
(4)随着指数结构改善,科技成长、新经济公司进入指数成为权重股,估值可能会有趋势性上移(比如科创板、创业板企业数量占比增大,恒指纳入腾讯;比如纳指中信息技术公司原来越多)。
彭博机:全球主要股指对比。
特征值:指数高位加速上涨+基金发行火热。
参见“公募基金发行数据跟踪”专题研究;基金发行热度高起并达到极值,都是值得警惕的流动性风险,背后是市场的赚钱效应吸引散户购买公募基金。作为增量资金的最后一波散户进场,最后的买入力量也被消耗。但这个指标是同步甚至偏滞后的,另外需要剔除一些异常情况(比如国家为了科创板保驾护航,批了不少基金,类似的政策引导情况)。可以进一步量化(按照分位数来刻画风险)。
整体来看,市场还是存在明显的“短炒基金”的现象。
可以跟踪的散户基金交易的习惯相关的数据。
美债收益率上行引发的流动性危机,可能引发全球资本市场的调整。
10)美元指数全球资本流动相关性研究
四、投资组合的平衡
悟空投资的金三角平衡策略是对桥水基金达里奥的风险平价模型的发展和进化。
,风险评价(平衡组合的风险),权重优化,还要有一定的冗余度(反脆弱性,随机性)。
组合配置后,会有一些意外的事情进入,导致预测结果会发生较大偏差;权重本质上是一个给定条件下的预测(最大熵解,最大似然概率),当外部条件变化时,预测结果当然会变化,风控就是要测算变化后的分布和先前分布的相对熵距离,如果偏离较大,就应该及时纠正组合配置。(贝叶斯思路)
市场特征的研究发掘(随机做,不断积累)
日历效应、二次探底、深V、行业主线、牛熊特征、量价特点等。
桥水基金达里奥的风险平价模型
上世纪 90 年代,桥水基金创始人达里奥首次提出了全天候策略,该策略的初衷是构建一个投资组合使其在不同的经济环境中都能有稳健的表现。桥水的全天候基金在过去 20 年内表现不俗,在 2008 年金融危机和 2010 年的欧债危机期间也有稳健的表现。PanAgora 资产管理公司的 Dr. Edward Qian 于 2005 年对风险平价进行了系统的总结。风险平价这一概念也随着桥水基金的优异表现而深入人心。
风险平价,顾名思义是对风险的配平。构建资产组合的目标在于使得各子资产的风险贡献相同。风险平价模型并不考虑优化收益率,只考虑风险。同样以波动率来衡量风险的话,子资产对整个资产组合的边际风险贡献可以表述为总风险Risk对于子资产权重的偏导数乘以权重)。
虽然风险平价模型不考虑优化资产组合的收益率,但是在一定的限制条件下,可以证明上述的风险平价模型的优化结果等价于优化资产组合的夏普比即最大夏普比组合。
风险平价模型改进。基于波动率的风险平价模型,虽然理论上来说,只需选择合适资产类别,并输入子资产间的协方差,即可达到分散化投资目的。但是该模型存在两个主要问题,一是风险并不一定等同于资产收益的波动率,二是固定的风险贡献会导致低风险资产的权重过高,例如债券。因此有必要对传统的风险平价模型进行改进。同时我们探究不同的风险计量方式对风险平价模型的影响,以及加入主动风险预算后风险平价模型的表现。
风险的计量
一般来说,在投资领域风险被定义为资产产生损失的可能性。波动率(volatility)衡量了资产相对于均值波动的范围。假设资产收益率分布满足对称分布的前提下,资产收益率的波动率衡量了资产在未来可能产生的损失平均值。因此最小化波动率在降低资产风险的同时也降低了未来的超额收益。此外实证研究表明,资产价格收益分布并不是对称的,而是有一定的偏度,所以波动率作为对资产损失不确定衡量有一定的缺陷。
多数资产的收益率分布具有厚尾(heavy tail)的特征,而尾部风险或者说黑天鹅一旦出现,其带来的损失很可能是永久的。于是人们提出在险价值(Value atRisk, VaR)用来衡量尾部风险。在险价值一般指,一定概率下资产在未来一段时间内的最大损失。
为置信度(一般为 0.95)VaR 值越大,说明一定概率下未来可能的损失越大。
最大回撤(Max Drawdown)指一段时间内最大累计收益和最小累计收益的差值。事实上最大回撤衡量在负收益率在时间尺度的聚集效应。
风险的定义为未来的不确定。在金融市场中,大多数投资者关注的是资产收益是否确定。 这种不确定主要为资产损失的不确定,包括两方面,一方面为出现损失的可能性,另一方面是损失的大小。因此对风险的衡量则是对低于预期的收益分布的刻画。波动率衡量了未来的可能的损失和可能的收益的期望(假设收益率分布对称)。
最大回撤衡量了损失在时间上的积聚性。每一类投资者对风险的关注点不同,风险承受能力也不同。因此,在使用风险平价模型来做资产配置的时候,投资者应当构建自己的风险模型,而不应该直接采用传统的波动率作为风险。
模型优化
经典的风险平价模型以波动率作为风险的衡量方式,使得最终子资产的风险贡献相同。这样会导致低波动低收益的资产具有更高的权重,产生结果就是组合收益率降低。为了平衡组合收益和风险,可以适当地对低波动低收益的资产增加杠杆。由于杠杆的存在,会同时放大资产的风险和收益,不会影响资产的夏普比。从而提高组合收益率。另一方面,模型子资产的协方差矩阵的互相关项衡量子资产之间的时序相关性,但在不同经济环境中不同资产,例如债券和股票的时序相关性,由于市场驱动因素的不同可能导致由负到正的转变,从而导致资产的配置过度集中暴露于同一风险,例如,通货紧缩时,股票商品的价格均倾向于下跌。因此,我们在配置资产的时候,应当忽略资产之间的时序相关性。
此外,为了提高资产组合的收益率,可以采用主动风险预算,使得组合的风险暴露向风险调整收益更高的资产倾斜,以获得更高的整体收益率。如果以夏普比来衡量风险调整收益,可以使用归一化的夏普比作为主动风险预算的权重。