文章来源:上海证券研究部
作 者:刘亦千 田慕慧 俞辰瑶
近年来,随着大数据技术的飞速发展,其在金融领域的应用也不断加深,众多金融机构都在尝试将大数据带来的强大信息优势与公司自身的投研能力相结合以更有效地指导投资。
国内外许多研究都表明,通过大数据获得的网络信息可以有效反映投资者情绪。Bollen等(2011)和 Wei Zhang等(2016)均利用社交网站上的信息,前者发现分析公众的情绪状态可以有效预测道琼斯工业指数的涨跌,后者提取了日常幸福感指标,发现对许多股票市场而言,幸福感指标与指数收益变化密切相关。此外,Bank等(2011)和 Wei Zhang等(2013)挖掘搜索引擎数据,发现搜索量的增加显著影响股票的交易行为。
基于大数据和证券市场的相关研究,国内外许多基金公司与互联网企业展开合作,充分利用互联网公司丰富的信息资源优势,获取投资者情绪等相关指标来指导投研和交易,由此大数据基金也应运而生。
一、 大数据基金的内涵及发展
1、大数据基金的内涵
大数据基金从本质上来说是量化基金的一类,但相较普通量化基金而言,大数据基金在利用传统量化指标的基础上,还融入了互联网上的各类公开信息,以及线上线下的支付信息等。此外,大数据基金还利用各项大数据前沿技术,如云计算、大规模并行处理数据库和分布式数据库等,充分挖掘和处理信息。
大数据基金主要的数据源有四类:1)普通搜索数据,如百度、360等网站上的客户关于证券市场的相关搜索记录;2)财经网站数据,如新浪财经、同花顺、东方财富等网站上客户对行业或个股的关注度指标;3)消费数据,如线上的淘宝、京东等网站上客户的购买记录,以及线下的POS机数据等;4)社交网站数据,如微博、雪球等社区上大家对证券市场的各种观点。
2、国内大数据基金发展历程
自 2014年 3月国内第一只大数据基金正式成立以来,大数据基金只数保持上升趋势,截至 2018 年 6 月 30 日,现存的大数据基金共计 21只(合并份额),此前有一只基金保本期结束到期,一只灵活配置型基金规模过小清盘。但从规模来看,大数据基金规模在 2015年上半年冲高至超过 200 亿后,受后市行情影响,规模有所回落,截至 2018 年 6 月30日,现存的大数据基金合计规模 119.82亿元。
二、大数据基金概览
自 2014年第一只大数据基金银河定投宝(519677)成立以来,截至2018年 6月 30日,共有 21只大数据基金(合并份额),包含 7只被动指数型基金,13只主动股混型基金和 1只保本型基金(下文中不与其他基金对比)。这些大数据基金跟踪的指数类型多样、大数据指标提供平台不同、涉及 14家基金公司,下文将从不同角度对这些基金进行对比:
1、 大数据指数: 情绪类指数波动较大,专家意见类指数风险较低
我们选取了市场上比较有代表性的 15 个大数据指数进行比较和分析,其中的 7个指数已有对应的被动指数型大数据基金产品。这些指数涉及到搜索数据(如百度、360 网站搜索)、财经数据(如新浪财经、同花顺、东方财富股票关注度)、消费数据(如蚂蚁金服、银联)和社交数据(如雪球大 V观点)等,根据其编制策略,大致可分为情绪类、行业景气类和专家意见类:
尽管大数据指数数量有限,我们通过一些统计数据(数据区间为2015年 1月 1日至 2018年 6月 30日)仍然可以看出一些不同类型指数的特征。采用情绪类指标编制的大数据指数,大多基于搜索量或者关注度数据,往往有追涨杀跌的特征,属于高弹性的指数,在三种类型的指数中年化回报最高,波动和回撤都最大。采用专家意见类指标编制的大数据基金,由于专家们在选股时兼顾了市场情绪与行业基本面,并且可能综合调研信息,因此收益波动较小,风险也较可控。采用行业景气类指标编制的大数据,主要依靠消费数据进行行业选择,偏向基本面研究,收益风险特征介于情绪类和专家意见类指数之间。