微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

536

金工深度研究:九坤Kaggle量化大赛有哪些启示?-20230130-23页

# Kaggle # 人工智能 大小:1.25M | 页数:23 | 上架时间:2023-02-01 | 语言:中文

类型: 策略

上传者: 智释雯

撰写机构: 华泰证券

出版日期: 2023-02-01

摘要:

人工智能系列之 64:从九坤 Kaggle 量化大赛高分方案中寻找借鉴本文梳理 2022 年九坤 Kaggle 量化大赛高分队伍解决方案,提炼出特征工程、损失函数、交叉验证、模型集成四个主要方向,并应用于华泰人工智能中证 500 指数增强策略改进。结果表明:(1)特征工程引入均值因子对神经网络有效;(2)CCC 损失优于 MSE 损失和 IC 损失;(3)时序交叉验证作用不明显;(4) 集成神经网络和决策树类模型提升较稳定。对比整合多项改进的模型与基线模型,回测期 2011 年至 2022 年内,年化超额收益从 14.2%提升至 17.0%,信息比率从 2.3/2.4 提升至 2.7。

多家头部量化机构在 Kaggle 发布竞赛,九坤竞赛贴近实际量化选股场景随着数据科学在线社区日益成熟,越来越多的爱好者投身于网络编程竞赛之中。Kaggle 是全球知名的数据科学在线平台之一,Two Sigma、Optiver 等头部量化机构曾在 Kaggle 发布挑战竞赛。国内量化私募九坤投资于 2022年 1 月启动 Kaggle 竞赛,吸引两千多只队伍参赛。比赛具体任务为基于给定的 A 股匿名特征,预测股票未来短期收益,最终评价指标为预测收益和真实收益的 IC 值,属于典型的监督学习问题,和实际量化选股场景较贴近。

四个改进方向:引入均值因子,引入 CCC 损失,时序交叉验证,模型集成我们梳理九坤 Kaggle 量化大赛高分队伍解决方案,提炼出四个改进方向。(1)特征工程引入截面上全部股票因子的均值,均值因子可能反映原始因子整体分布的时变特性,是市场环境的一种简单表达。(2)损失函数引入一致性相关系数 CCC,可视作 IC 和 MSE 的融合,兼顾相关性和距离。(3)采用时序交叉验证选取最优超参数。(4)集成不同类型机器学习模型。以神经网络和 XGBoost 构建中证 500 指数增强策略作为基线,测试上述技巧的改进效果。

均值因子对神经网络有效,加权 CCC 损失回测表现好,模型集成提升稳定四项改进技巧效果各异。特征工程引入的均值因子对神经网络有提升,但削弱了 XGBoost 模型。损失函数中,MSE 表现不突出;IC 损失单因子测试表现好,但指增组合回测表现差;CCC 损失在单因子测试表现一般,但指增组合回测表现较好;加权均优于等权。交叉验证调参改进不显著,考虑到时间开销大,性价比不高,算力有限前提下,使用经验超参数即可。模型集成提升较稳定,神经网络类和决策树类模型有互补效果。

讨论:(1)如何使用弱因子;(2)因子合成和组合优化的目标错配问题研究发现均值因子对神经网络有效但对 XGBoost 无效。均值因子属于弱因子,有用但比重不宜过大。XGBoost 引入弱因子后,特征采样使原始因子可能被排除在外,从而削弱模型。神经网络可通过预处理缩小取值,有限度地使用弱因子。研究还发现 IC 损失单因子测试优于 MSE 损失,但指增组合表现差,本质是因子合成和组合优化的目标错配。IC 属于全局统计量,不会侧重于个别头部样本,但这些样本可能对组合优化影响较大。MSE 的特点之一是给予极端误差较大惩罚,恰好弥补IC弱点。CCC融合IC和MSE,兼顾共性和个性,是一类理想的损失函数。

风险提示:人工智能挖掘市场规律是对历史的总结,市场规律在未来可能失效。人工智能技术存在过拟合风险。深度学习模型受随机数影响较大,本文未进行随机数敏感性测试。本文测试的选股模型调仓频率较高,假定以 vwap价格成交,忽略其他交易层面因素影响。

展开>> 收起<<

请登录,再发表你的看法

登录/注册

智释雯

相关报告

更多

浏览量

(485)

下载

(11)

收藏

分享

下载

*

投诉主题:

  • 下载 下架函

*

描述:

*

图片:

上传图片

上传图片

最多上传2张图片

提示

取消 确定

提示

取消 确定

提示

取消 确定

积分充值

选择充值金额:

30积分

6.00元

90积分

18.00元

150+8积分

30.00元

340+20积分

68.00元

640+50积分

128.00元

990+70积分

198.00元

1640+140积分

328.00元

微信支付

余额支付

积分充值

填写信息

姓名*

邮箱*

姓名*

邮箱*

注:填写完信息后,该报告便可下载

选择下载内容

全选

取消全选

已选 1