这篇研究论文提出了一种基于强化学习算法的商品交易策略。该算法在包含交易成本和资产动态驱动因素的现实环境中生成交易策略,并在线性因素和二次交易成本的条件下,与分析最优解进行了基准测试。研究还考虑了更贴近实际情况的非线性动态模型,并通过模拟证明,在WTI原油价格的合成数据上,该强化学习算法优于线性化模型的理论最优策略。 文章详细介绍了该算法,包括SARSA算法的改进、神经网络的使用以及模型参数的校准。最后,研究比较了不同非线性模型的性能,并对未来的研究方向进行了展望。


EP54 强化学习与商品期货交易
5分钟 ·
116·
0