量化投资与机器学习 发布于 2020-05-08 19:23:16
标星★置顶公众号 爱你们♥ 作者:Ryan 编译:1+1=6未经允许,禁止转载
Tick数据是市场微观结构分析中最有用的数据。可是,Tick数据也是最容易受数据损坏影响,因此在用于任何形式的分析之前必须要进行清洗和调整。
1数据损坏的原因是什么?由于数据量大,Tick数据特别容易受到数据损坏,有些股票的数据可以达到每天10个Tick,这使得错误检测非常具有挑战性。通常情况下,是信号中断或信号延迟导致了损坏的或无序的数据。
2定义损坏数据在生成数据过滤器之前,我们首先需要指定什么是构成Tick损坏的因素。一个常见的错误是,仅仅因为测试数据与其附近的数据点不一致(偏差特别大),从而排除有效数据(事实上,这些Tick在模拟交易中往往最有用,因为它们提供了市场方向的信息,或者它们本身就是交易机会)。 (
点击阅读全文 )
→
免费下载App,立即成为ETF达人