基金王德英:量化投资本质是数据的分析与决策" align=middle src="http://i1.hexunimg.cn/2016-11-19/186975258.png">
和讯' 股票 消息 2016全球量化金融峰会在北京举行,和讯股票 作为特邀媒体全程直播。
博时基金副总裁王德英表示,不管是主动投资还是量化投资,如果总结本质,实质都是数据的分析与决策。因为主动投资也是根据调研的数据,根据他的盈利的情况来预测企业未来的成长情况,未来它的二级市场股价的变化情况,量化也是一样,根据过往的数据来预测未来的表现。
以下为演讲实录:
王德英(博时基金副总裁)
家下午好,非常高兴有这样一个机会,和大家讨论沟通量化投资方面的问题。
我今天报道的题目相对窄一点,虽然我们板块叫“大资管与量化投资”,但我这个要稍微聚焦一点,我主要和大家汇报的是大数据技术对资产管理公司和量化投资带来哪些新的机会。
我们先看大数据的价值。在说到大数据之前,我想也先介绍一下公募基金公司、资产管理公司基本的投研框架。其实基金公司也有一条无形的流水线,只是我们生产的是几种产品,不是传统的可见的物理产品,基本的流程分投资前、投资中和投资后,一个典型的基金公司。投资前主要做研究分析,帮助决策,投资中做组合搭建和交易的执行,完成交易之后,事后还要做风险的评估和分析,分析的结果再用于事前和事中的研究和决策。这里面核心的就是研究和决策的环节,在研究环节,比较典型的基金公司都有' 宏观研究的部门,也有做行业和各股研究的部门,一般会从宏观、行业和各股这三个层次,进行证券市场的研究。到了决策环节,基金经理主要是完成三个层次的配置,如果是自上而下的说,首先就是资产配置,如果只做股票 来说狭义的就是仓位的控制或者做时机的选择。接下来一层是行业配置,对股票 里面一定的仓位进行各个行业的配置比例,最下一个层次当然是' 个股的配置,每个行业里面每个个股的选择。真正基金经理实际做的时候是自下而上和自上而下相结合的,我们都看到很多策略是精选个股策略,说的是做个股层面的配置,也会结合做一些仓位的判断,结合起来来做组合的搭建。
按这三个层次如果做分析的话,中国的基金经理更擅长做哪个层次,我们选了一些样本,中国公募基金从2005年到2013年的数据来看,公募基金带有股票 的,包括普通股票 型、偏股型、混合型,这里面都是含有股票 的一些样本,看到2005年的时候数量还比较少,基金的数量只有不到一百只,到了2013年就是五六百了规模也是一样,2005年的只有1200多亿,到2013年是一万多亿,这是整个样本的情况。
我们再看做主动选择的基金经理,在三个层次上的能力:
首先是择时方面,平均来看择时方面的贡献度是非常小的,只有零点几,这说明中国的公募基金在择时方面做得并不是太好,基本上概率比一半多一点。
第二,行业的配置。我们看到加总的结果是一个正数,是非常低的,这说明平均来说或者是汇总结果来看,中国的公募基金经理在行业选择上的能力或者是贡献度也不是很高。
第三,个股的选择。大家看到选择个股上的贡献非常大,这也体现了中国公募基金经理的特点,大部分收益是来自于个股的选择。
当然最近几年量化投资在公募基金发展也非常快,最近四五年很多在公募基金做量化的最早一批也是从华尔街回来的,很多模型、方法体系也是借鉴国外的体系,当然最近几年也是逐步的本地化,结合中国市场的情况。头几年国外的模型搬到国内来还有一些水土不服,表现出来就是收益的波动性大一些,但是最近两三年我们看到这套模型在中国市场是越来越适应和成熟,表现出来就是超额收益越来越稳定。
说到量化常用的机制,多因子量化策略和多策略模型,比较常见的一类就是财务类的因子,比如说估值、市盈率、市净率、营业收入。另外就是市场驱动类的因子,包括市场的交易量的变化等等,一般的量化模型都有至少几十个因子,但是分类机上是这两类,一个是财务类的因子,一个是市场类的因子
其实不管是主动投资还是量化投资,如果总结本质,实质都是数据的分析与决策,不知道大家是否认同。因为主动投资也是根据调研的数据,根据他的盈利的情况来预测企业未来的成长情况,未来它的二级市场股价的变化情况,量化也是一样,根据过往的数据来预测未来的表现,如果说这样一个说法成立的话,在同样的分析逻辑下,我们认为数据的质量和数量决定了结果的准确性,或者说数据的数量越大对市场和个股分析的确定性越强,这是一个基本逻辑,既然是根据过去的数据,用分析模型、分析方法来判断未来,按照这个程序,所依据的东西越多,对未来的判断准确性更强,这个逻辑基本是成立的。也就是基于这样的逻辑,我们能够看到大数据对投资的价值。
传统策略基本上是基于上市公的' 季报、数据和其他市场的数据,这是传统的' 投资策略,不管是主动基金经理还是量化的。大数据跟传统的策略比,我们可以看到还有几个特点:
第一,数据量更大,这个不用解释。
第二,数据维度更多,原来更多的上市公司的季报、年报是一些财务类的数据,而大数据不光有财务的金额、交易量、销售量的指标,还有一些供求关系的变化、价格的变化,这样一些数据在传统的季报或者是数据里面是没有的,在大数据里面这样的数据是可以获取的。
第三,数据的颗粒度更细。原来得到的数据季报是每个季度才会有,但是大数据每时每刻都会产生,所以颗粒度更细一些。
第四,数据的指标现象性更强,原来你获取数据都是它的经营活动过了一段以后才能转化为财务数据,转化为统计报表,才能看到,但是实时交易的数据,每天都在发生,通过大数据可以更早的获取企业的交易情况的变化。
如果形象打个比方,原来我们对上市公司的刻画是一个平面的,因为维度是很少的,现在是一个立体的,因为你的维度更高了,原来你是一张张照片,因为你每个季度只能给一张照片,现在因为你每时每刻都能看到它的变化,你看到的是一段录像,我想从平面到立体,从独立的照片到一段动态的图象,这样一比较很显然。我们在大数据时代,对上市公司的刻划要更加准确、确定。说到大数据,也涉及到整个股市的表现,和三个方面有关:
第一,决定整个股市中枢的估值中枢的是实体经济的发展。
第二,市场的预期,或者大家的信心。
第三,市场的流动性,资金的宽裕程度。
具体到每个股票 上面,是两方面:
第一,基本面的情况。
第二,大家对它的信息,或者情绪。
同样表现在大数据方面,现在市场上有非常多的大数据指数、产品,分为两类,一类是基于基本面的大数据,它反映的是企业、行业的经营情况。第二类就是市场情绪类的大数据,比如一些搜索、自选股。
在基于大数据的价值,我也分享一个具体的案例:淘宝双11刚刚过去,今年又创了新高,怎么利用这上面的交易大数据,转化我们对投资、股票 的选择,它是不是真的能给投资带来价值? 这个指数叫淘金大数据一百指数,合作方是蚂蚁金服。其实它基本的逻辑是因为中国现在网络商品销售的量占了中国社会零售消费品的总交易量的10%,蚂蚁金服所服务的电商的量又占了整个网上总量的70%,我们认为蚂蚁金服电商的交易数据,是能够代表中国大' 消费行业的一个发展趋势的,因为你有足够的量才有代表性。
第二点,当某一个行业或者企业网上交易量有明显趋势的时候,比如交易量持续地提升,我们就有合理的理由预测这个行业过几个月之后,它的经营情况体现在财务报表上的经营情况和改善。进而最终会体现在二级市场的股价方面,基本逻辑是这样。
那么怎么能把电商上面5000多类商品,一步步转化成各股的选择?有一个过程:
第一步要把这5000多种商品影射到中证三级行业,通过人工匹配的方法,可以找到35个行业,这35个行业覆盖了股票 是1700多只,基本占了中国股票 市场70%,覆盖率的代表性还是可以的。以后随着蚂蚁金服电商业的扩展,行业还会继续扩大。先把1700个股票 现象确定,把5000多种商品对应过来,然后就从1700只选股票 。
第二步,要从电商数据里找出哪些指标对这些上市公司的股市表现,有一个先导的价值,这个要做基础数据的处理,汇总完了以后,我们主要对销售量、金额、商品数量、买卖人数、定价的数量、价格等等进行基础处理。这里面还要做一些特殊的去噪声的操作,比如双11一天的量可能消耗了未来一个月的量,这种我们要做一个特殊处理,处理完了以后要找指标,最后发现有三类指标,电商的指标对股市的敏感度是更高的,或者有指导价值的:
第一类,成长指标,比如销售金额、销售量、环比增长率。
第二类,供需指标,买卖人数的变化,这个我们从传统的数据调研,是没有这样一些数据的,每天买和卖的人数的变化,也能代表一个趋势。
第三类,价格的指标。比如白酒,不同的行业不一样,白酒有价格的变化,比二级市场的变化提前三到四个月的时间,白酒这个行业价格更敏感。纺织业行业,大概的指标领先二级市场的表现两三个月,它更敏感是它的供需关系,不是交易量,供需关系提前的量更明显。
发现这些指标之后,我们把这些指标做成一个大数据因子,比如说交易量高的我们就给一高的分值,交易量下降的,我们给它一个小的或负的分值,这样就得到每一个行业,它在这个指标上的大数据因子的打分,这个分值和我们原来量化模型的一些财务因子,和市场驱动两大类因子,加总起来就可以得到每个股票 的多因子的分值。最后从1700只里面选最好的一百只,分值最高的作为我们的,每月调一次,这样完全能让一个基本逻辑,怎么把淘宝上的每天交易量最后转化成一个股票 的选择。
这样逻辑编制的数据指数表现怎么样呢?这个数据我们从2012年开始的,跟沪深300、' 中证500比每年大幅的领先。其中这个指数从2014年底是一个真实运作的,2014年前是一个模拟的,这个指数不光战胜沪深300,还战胜了中证500,因为在中国最近几年是一个成长股偏小盘的市场,能战胜沪深300是相对容易的,战争中证500相对是难的。如果有一个策略如果能够持续战胜中证500、沪深300的话,我们觉得相对是一个比较好的策略。
基于这样一套逻辑,我们也做了其他一些指数,也是两大类:基本面的大数据因子和情绪类的因子。
基本面刚才淘金利用一个网上的大数据,网下的我们采用银联卡刷卡的数据,利用这个数据也做了一个消费的,覆盖了33个的行业,也是一个大消费的大数据指数,这个表现也是非常好的。大家看到这也是今年以来,它的收益比,比淘金还要高一点,3.67%,从年初到10月底的时候。
我们也做了一些情绪类的,一个是雪球合作的,雪球是中国做社交选股平台最大的之一,上面有很多草根' 炒股的,' 业绩也做得不错。我们也认为我们采用它的一个自选股,自建组合的一个数据。血球上面有几十万、上百万自己做自建组合的草根投资者,我们从里面选了1000个长期业绩非常好的投资者,把这1000个根据他每个月度加仓和减仓,加仓最多的我们给他一个高的分值,减仓最多的给他一个低的分值,通过这种方法来体现把市场股票 的情绪,转化成一个大数据因子,最后转化成股票 的选择。这里面还有其他的大数据指数,粉丝数、用户的活跃度、点评的数量等,有很多大数据指数可以用。表现也还是可以,每年战胜300和500。
利用' 东方财富(' 300059,' 股吧)网的股吧、' 股评、新闻这样一些数据,来作为市场情绪的一个因子,也做了一个指数,其实这些指数形式是一个指数,但它其实每个月都调一次仓,我们其实把它定义成一个主动策略的被动化,它形式上是一个被动产品,其实背后的策略还是主动策略,而且可以看到这个指数表现还可以,今年以来到10月底有4.42%的收益,这都是实际运作的水平。
(责任编辑:陈晓伟 HF093)
和讯网今天刊登了《博时基金王德英:量化投资本质是数据的分析与决策》一文,关于此事的更多报道,请在和讯财经客户端上阅读。