神经网络与数字货币量化交易系列(2)

宽客在线 发布于 2020-02-11 14:06:44
1.介绍
上一篇文章介绍了使用LSTM网络预测比特币价格 https://www.fmz.com/digest-topic/4035 ,正如文章提到的,只是一个练手的小项目,用来熟悉RNN以及pytorch。本文将介绍使用强化学习的方法,直接训练交易策略。强化学习的模型为OpenAI开源的PPO,环境则参考了gym的样式。为了方便理解和测试,LSTM的PPO模型和回测的gym环境都直接编写未使用现成的包。
PPO,全称Proximal Policy Optimization,是对Policy Graident,即策略梯度的一种优化改进。gym也是由OpenAI发布,可以与策略网络交互,反馈目前环境的状态和奖励,就像强化学习的练习用使用LSTM的PPO模型直接根据比特币的行情信息做出买入、卖出或不操作的指令,由回测环境给出反馈,通过训练不断优化模型,达到策略盈利的目的 ( 点击阅读全文 )

免费下载App,立即成为ETF达人
0 收藏

神经网络与数字货币量化交易系列(1)

  • 宽客在线 2020-02-10 17:21:59
1.简单介绍深度神经网络这些年越来越热门,在很多领域解决了过去无法解决的难题,体现了强大的能力。在时间序列的预测上,常用的神经网络价格是RNN,因为RNN不仅有当前数据输入,还有历史数据的输入,当然,当我们谈...
3 收藏

生成对抗网络(GAN)系列:WGAN与金融时序(附代码)

  • 量化投资与机器学习 2020-06-25 12:00:54
作者:Mirko 编译:酸的馒头端午安康生成对抗网络应用量化投资系列(一)获取完整代码,见文末1引言过拟合是我们试图将机器学习技术应用于时间序列时遇到的问题之一。出现这个问题是因为我们使用我们所知道...
0 收藏

Python王牌加速库2:深度学习下的障碍期权定价

  • 量化投资与机器学习 2020-04-24 14:25:24
标星★置顶公众号 爱你们♥ 作者:Yi Dong 编译:1+1=61前言上一期推文中,我们使用了Numba和CuPy来运行蒙特卡罗模拟来确定亚式障碍期权的价格。Python王牌加速库1:奇异...
0 收藏

【策略】价值 or 成长风格切换(2019.9.27)

  • 时光基 2019-09-30 08:00:00
2009年以来,A股市场2-3年就会经历一次风格转换,2009-2010年,2013年-2015年,成长风格占优;2011-2012年,2016-2018年价值风格占优。但成长与价值不是对立的两面,市场风格之...
0 收藏

【分享吧】时间卷积网络在商品指数预测应用

  • 大连飞创 2019-08-29 16:57:58
摘要 商品指数预测兼具横截面与时间序列属性,传统回归模型对指数预测已展示一定效果,但也存在“预测多基于假设条件、多维线性预测无法挖掘数据间非线性关系、预测频率不满足使用需求”等不足。人工智能算法因数...

发布
问题