华泰金融工程 发布于 2020-10-23 09:36:14
林晓明 S0570516010001 SFC No. BPY421 研究员
李子钰 S0570519110003 研究员何 康 S0570520080004 研究员王晨宇 S0570519110038 联系人
报告发布时间:2020年10月22日
摘要本文研究了基于金融新闻的舆情因子,并测试了BERT文本情感分类模型随着国内量化投资的发展,挖掘另类数据中的增量信息逐渐受投资者关注。另类数据中一大类数据就是舆情文本数据。本文提取Wind金融新闻数据中的情感正负面标签构建新闻舆情因子,因子在沪深300内表现最好。进一步地,本文介绍了前沿的自然语言处理(NLP)模型BERT的原理和训练方法,并基于Wind的有标注金融新闻数据训练金融新闻情感分类模型,模型在正负 (
点击阅读全文 )
→
免费下载App,立即成为ETF达人