大数据基金的发展情况

ETF之家 发布于 2018-07-19 14:23:40

文章来源:上海证券研究部

作       者:刘亦千 田慕慧 俞辰瑶
 

  近年来,随着大数据技术的飞速发展,其在金融领域的应用也不断加深,众多金融机构都在尝试将大数据带来的强大信息优势与公司自身的投研能力相结合以更有效地指导投资。

  国内外许多研究都表明,通过大数据获得的网络信息可以有效反映投资者情绪。Bollen等(2011)和 Wei Zhang等(2016)均利用社交网站上的信息,前者发现分析公众的情绪状态可以有效预测道琼斯工业指数的涨跌,后者提取了日常幸福感指标,发现对许多股票市场而言,幸福感指标与指数收益变化密切相关。此外,Bank等(2011)和 Wei Zhang等(2013)挖掘搜索引擎数据,发现搜索量的增加显著影响股票的交易行为。

  基于大数据和证券市场的相关研究,国内外许多基金公司与互联网企业展开合作,充分利用互联网公司丰富的信息资源优势,获取投资者情绪等相关指标来指导投研和交易,由此大数据基金也应运而生。

一、 大数据基金的内涵及发展

1、大数据基金的内涵

  大数据基金从本质上来说是量化基金的一类,但相较普通量化基金而言,大数据基金在利用传统量化指标的基础上,还融入了互联网上的各类公开信息,以及线上线下的支付信息等。此外,大数据基金还利用各项大数据前沿技术,如云计算、大规模并行处理数据库和分布式数据库等,充分挖掘和处理信息。

  大数据基金主要的数据源有四类:1)普通搜索数据,如百度、360等网站上的客户关于证券市场的相关搜索记录;2)财经网站数据,如新浪财经、同花顺、东方财富等网站上客户对行业或个股的关注度指标;3)消费数据,如线上的淘宝、京东等网站上客户的购买记录,以及线下的POS机数据等;4)社交网站数据,如微博、雪球等社区上大家对证券市场的各种观点。

2、国内大数据基金发展历程

  自 2014年 3月国内第一只大数据基金正式成立以来,大数据基金只数保持上升趋势,截至 2018 年 6 月 30 日,现存的大数据基金共计 21只(合并份额),此前有一只基金保本期结束到期,一只灵活配置型基金规模过小清盘。但从规模来看,大数据基金规模在 2015年上半年冲高至超过 200 亿后,受后市行情影响,规模有所回落,截至 2018 年 6 月30日,现存的大数据基金合计规模 119.82亿元。<p align="center"></p>

二、大数据基金概览

  自 2014年第一只大数据基金银河定投宝(519677)成立以来,截至2018年 6月 30日,共有 21只大数据基金(合并份额),包含 7只被动指数型基金,13只主动股混型基金和 1只保本型基金(下文中不与其他基金对比)。这些大数据基金跟踪的指数类型多样、大数据指标提供平台不同、涉及 14家基金公司,下文将从不同角度对这些基金进行对比:<p align="center"></p> <p align="center"></p>

1、 大数据指数: 情绪类指数波动较大,专家意见类指数风险较低

  我们选取了市场上比较有代表性的 15 个大数据指数进行比较和分析,其中的 7个指数已有对应的被动指数型大数据基金产品。这些指数涉及到搜索数据(如百度、360 网站搜索)、财经数据(如新浪财经、同花顺、东方财富股票关注度)、消费数据(如蚂蚁金服、银联)和社交数据(如雪球大 V观点)等,根据其编制策略,大致可分为情绪类、行业景气类和专家意见类:<p align="center"></p> <p align="center"></p>

  尽管大数据指数数量有限,我们通过一些统计数据(数据区间为2015年 1月 1日至 2018年 6月 30日)仍然可以看出一些不同类型指数的特征。采用情绪类指标编制的大数据指数,大多基于搜索量或者关注度数据,往往有追涨杀跌的特征,属于高弹性的指数,在三种类型的指数中年化回报最高,波动和回撤都最大。采用专家意见类指标编制的大数据基金,由于专家们在选股时兼顾了市场情绪与行业基本面,并且可能综合调研信息,因此收益波动较小,风险也较可控。采用行业景气类指标编制的大数据,主要依靠消费数据进行行业选择,偏向基本面研究,收益风险特征介于情绪类和专家意见类指数之间。<p align="center"></p>

2、 大数据平台特色:BAJT 争相布局,股票分析软件、支付平台对垒

  根据基金招募说明书以及一些网络平台的公开信息,现存的 20只大数据基金(博时招财二号为保本基金,不参与比较)中,除天弘云端生活优选和银华大数据未明确提到外部平台之外,其余 18 只基金分别由10个平台提供大数据。

规模最大:新浪

  新浪是目前合作基金产品最大的平台,基于新浪大数据的两只基金均为南方基金发行的被动指数型基金,规模共 41.13亿,占所有大数据基金规模约 1/3。两只产品分别跟踪大数据 100 和大数据 300指数,这两个指数是国内首批基于财经媒体与社交平台挖掘投资情绪并应用于指数选样的策略指数。

BAJT争相布局

  与百度合作的基金数量最多,有 5只,主要是广发基金和易方达基金发行的。广发基金的 4只大数据基金都以情绪类的搜索因子作为数据来源,涵盖成长、价值不同风格;易方达易百智能量化策略则是首只借助百度在人工智能技术和算法方面的优势的基金。蚂蚁金服由于旗下有支付宝、余额宝、蚂蚁花呗等业务板块,因此与华夏、博时合作的基金产品均以消费数据形成的行业景气类指标为因子。腾讯是第一家涉足大数据指数的平台,它与济安金信共同开发的腾讯济安价值 100指数以及跟踪该指数的银河定投宝均是大数据基金的行业先驱。京东虽然是 BAJT中最晚进入大数据基金的平台,但其与东方红合作的东方红京东大数据是几家平台中规模最大的基金。

股票分析软件、支付平台对垒

  东方财富和同花顺作为同是股票分析软件的对手,能够搜集到股票关注度、点击量、股吧讨论等直接关系到个股的数据,目前合作的基金规模都不大。银联、通联作为同是支付平台的对手,主要采集消费数据,各合作了一只基金,规模也都不大。<p align="center"></p>

3、 基金公司特色:主被动管理、成长价值风格偏好不同

  目前仍有大数据基金的基金公司共 14家,一些基金公司仅发行一只基金,由于数量少、规模小或成立时间尚短等原因,较难归纳出基金公司的偏好,因此仅根据多只产品共同特征或指数编制特征来总结基金公司的特色。

  南方基金管理规模最大,两只基金均为被动指数型基金;与之对应的是广发基金发行数量最多,均为主动管理的灵活配置型基金,风格也有成长价值不同类型。银河基金的定投宝由于跟踪的指数选择市场价格相对低估的 100家上市公司股票为样本,因此风格偏价值;与之对应的则是大成基金的互联网+大数据,以互联网+概念股票为样本,因此风格偏成长。此外,博时基金是唯一一家与两个不同数据平台合作的基金公司,而易方达基金则是唯一一家提出借助人工智能算法来管理的基金公司。<p align="center"></p>

三、大数据基金业绩对比与分析

  大数据基金发展初衷是希望将大数据带来的强大信息优势与公司自身的投研能力相结合以更有效地指导投资,而大数据基金发展至今也经历了波澜起伏、风格变换的市场。下文将从大数据基金与市场指数对比、大数据基金与普通量化基金对比、大数据基金内部对比几个方面来剖析基金的业绩,希望能找出大数据基金的业绩特点、不同产品的风格特征,以便为投资提供指导。

1、 大数据基金与市场指数比较:震荡市优势较为明显

  从第一只大数据基金成立以来,我们将市场根据趋势划分(3 段上涨+3段下跌+震荡),并将基金成立三个月以后的业绩作为样本(包括已经清盘的基金),来分析大数据基金在不同市场中的业绩特征。

  样本数不小于 5只基金的两次上涨,大数据基金在 2015年末的反弹中战胜上证综指和混基指数,未战胜股基指数;在 2016年下半年开始的缓慢上涨中,大数据基金未战胜上证综指和基金指数。样本数不小于 5只基金的两次下跌,大数据基金在熔断中战胜上涨综指和股基指数,未战胜混基指数;在今年以来的下跌中,大数据基金战胜上证综指但未战胜基金指数。在 2016年上半年的震荡市中,大数据基金战胜上证综指和基金指数。总体而言,由于目前大数据基金数量较少且普遍时间尚短,在趋势性市场中未表现出强烈的优势,而在震荡市中优势较为明显。<p align="center"></p>

2、 大数据基金与普通量化基金: 业绩弹性更大

  从大数据基金与普通量化基金业绩对比可以发现:在市场上涨时,大数据基金净值涨幅高于普通量化基金,而在下跌行情中大数据基金的净值回撤幅度亦大于普通量化基金,在震荡行情中大数据基金的表现优于普通量化基金。相较普通量化基金而言,大数据基金更多地使用了情绪面因子,这类因子具有“追涨杀跌”的特性,使得基金业绩弹性更大。<p align="center"></p>

3、 被动指数型大数据基金对比

使用行业景气类指标的基金近两年表现最佳

  自 2016年的熔断以后,A股市场经历震荡(2016/2/1-2016/6/30)、上涨(2016/7/1-2018/1/26)和下跌(2018/1/27-2018/6/30)三个阶段,通过对 7只被动指数型大数据基金进行内部对比,可以看到在震荡市场中,运用行业景气类指标的博时淘金大数据 100基金表现好于其他产品;在2016下半年至 2018年初的缓慢上涨市场中,博时的两只运用行业景气类指标的产品平均业绩好于运用情绪类和专家意见类指标的基金的平均业绩;而在下跌市场中,博时的两只运用行业景气类指标的产品平均跌幅也小于运用情绪类和专家意见类指标的基金的平均跌幅。总体而言,在上涨、震荡、下跌三类市场中,运用行业景气类指标的基金平均业绩表现均好于运用情绪类、专家意见类指标的基金平均业绩。这可能是由于在 2015 年牛市退烧之后,市场给予基本面的重视程度提升,而行业景气类指标正是基于基本面的消费类数据而设计的。<p align="center"></p>

基金风格:多数平衡偏价值,仅大成互联网+为成长风格

  根据 7只被动指数型基金年报和季报全部持仓风格的分析,博时银智大数据 100、南方大数据 300 和银河定投宝成立以来基本维持价值风格,因此这三只指数基金在 2017年表现最为出色。博时淘金大数据 100和南方大数据 100属于平衡风格,而广发中证百发 100的持仓风格则随市场风格变化而变化。成长风格的基金只有一只,是大成互联网+大数据,由于选股样本限定在互联网+,因此持仓以中小盘成长股为主。<p align="center"></p>

产品优化:关注中证东方财富大数据 100指数

  这一部分我们试图寻找是否有风险收益特性优秀的大数据指数仍未有产品跟踪。由于大部分数据发布于 2016年之前,因此我们把 2013年1月 1日至 2015 年 12月 31 日作为指数业绩的回测区间,把 2016年 1月 1日至 2018年 6月 30日作为指数的实盘期间,分别观察回测和实盘期间的年化回报,以及 2013年 1月 1日以来的年化波动。通过对现存指数的风险收益分析,可以看到追求高风险高回报的可以关注中证东方财富大数据 188指数,而中证东方财富大数据 100指数则是一个夏普比率比较高的指数,至今还没有产品跟踪。<p align="center"></p>

4、 主动股混型大数据基金对比

  受数据来源影响,不同类型的主动股混型大数据基金在投资策略和业绩表现上差异较大,为增强可比性,本文将行业景气类和情绪类的主动股混型大数据基金分开对比。

行业景气类:东方红京东大数据表现较优

  在投资策略上,行业景气类的四只主动股混型大数据基金均为先采用消费数据自上而下进行行业选择,再精选个股。从行业集中度上来看,天弘云端生活优选和东方红京东大数据行业集中度高,浙商大数据智选消费行业集中度适中,而华夏网购精选的行业选择则较为分散。

  从业绩表现来看,对比成立时间相对长的天弘云端生活优选和东方红京东大数据,可以发现在震荡市中,前者净值涨幅大于后者,而在其他的上涨和下跌行情中,东方红京东大数据的表现更为优异。分析基金公布的持仓数据可以发现,东方红京东大数据长期保持对大消费板块的配置,2017年增加对化工行业的投资,而天弘云端生活优选则重配机械设备、电子行业,在大消费上的配置较前者低一些。自 2015年底以来,大消费板块在股市下行的环境中展现出了良好的抗跌能力,在上涨环境中更是遥遥领先于其他板块,使得更为重仓大消费的东方红京东大数据在这两种行情中表现更为突出;而在 2016年的震荡行情中,天弘云端生活优选重仓的电子、有色和食品饮料行业是涨幅最靠前的 3个行业,使得基金在该阶段业绩表现突出。<p align="center"></p> <p align="center"></p>

情绪类:基金业绩表现有所分化

  情绪类的主动管理大数据基金共有 8 只,多成立于 2016 年之后,成立时间相对较短,业绩表现有所分化,另有一只基金因为规模过小已清盘。情绪类的主动管理大数据基金中成立时间最长的广发百发大数据,在成立初期经历熔断,推测由于其股票仓位不高所以相较其他大数据基金净值受伤较少,在之后的几轮行情中该基金的走势与大数据基金平均差异不大。基于此基金,广发后续又发了广发百发大数据策略成长和广发百发大数据策略价值,区别于广发百发大数据,这两只基金的风格更为明确,前者为成长风格而后者为价值风格,从持股的市值属性来看,前者更多持有中小盘股票,而后者更多持有大中盘股票。泰达宏利同顺大数据的弹性业绩反映了情绪类因子导致的“追涨杀跌”的特征,而银华大数据成立以来业绩不佳。<p align="center"></p>

四、结论与建议

1、 大数据基金数量较少、业绩分化

  如果说 2014年是大数据基金的元年,那么 2015年可以算是大数据基金关注度最高、数量和规模都爆发式增长的一年。2015年,大部分大数据指数都在这一年发布,9只大数据基金成立,规模冲破 200亿 ,BAJT争相入场,然而牛市的破灭似乎也浇灭了市场对于大数据基金的关注度。2016年 8只大数据基金成立,2017年 3只,2018年 1只且出现基金清盘,由于大数据基金整体业绩并不突出,再加上市场出现熔断以及一九分化这样的极端状况,大数据基金的发展陷入瓶颈。

  目前市场上仅有 21只大数据基金(合并份额),由于数量较少、基金采取的策略和风格多样,因此在数据对比和分析上的结论仅供参考。尽管大数据基金平均业绩并不突出,但是内部分化较大,一些绩优基金仍然值得关注。

2、 不同策略下的绩优基金仍值得关注

  根据基金采用的策略和持仓风格不同,同时基于近几年的业绩,可以挖掘出几只业绩持续优秀的产品。被动指数型基金方面,价值风格的基金南方大数据 300A(001420)成立以来相对沪深 300有累计 25.5%、年化近 8%的超额收益,成长风格的大成互联网+大数据 A(002236)相对创业板指有累计 9.5%、年化近 4%的的超额收益。主动管理型基金方面,东方红京东大数据(001564)在 2016年和 2017年这两个完整年度同类排名在前 10%。

3、 产品亟需优化:产品优化与模型优化

  随着互联网和计算机技术不断进步,国外巨头投行对大数据、人工智能都青睐有加,而且取得了不少进展。国内利用大数据采集和各种算法来指导投资仍处在发展初期阶段,当前整体业绩欠佳并不代表大数据基金不行,可能是利用大数据的基金产品或者模型需要进一步优化。一方面,现存的一些历史业绩优秀的大数据指数还没有产品进行跟踪;另一方面,当前市场上不少大数据采集的是散户的情绪指数、搜索行为,对于如何处理这些大数据,以及是否能采集其他关键数据(例如机构投资者或基金经理相关指标)仍然需要探索与努力。<p align="center"></p>

0 条评论

发布
问题