林曉明 S0570516010001
SFC No. BPY421 研究員
李子鈺 S0570519110003
SFC No. BRV743 研究員
何 康 S0570520080004
SFC No. BRB318 研究員
報告發布時間:2022年01月09日
摘要
人工智慧系列 52:初步探索基於神經網路的組合最佳化
在基於因子的量化投資流程中,因子生成、多因子合成、組合最佳化是三個重要步驟。組合最佳化一般是指透過凸最佳化方法將收益預測轉換為資產權重的步驟,本文將嘗試把組合最佳化融入到神經網路中,構建端到端的量化投資框架, 該框架輸入資產的原始資料,透過神經網路進行特徵提取和合成,再透過可傳播梯度的凸最佳化層(如CvxpyLayers)最佳化得到資產權重,目標函式可直接定義為資產組合的收益率或其他指標,並以該目標最佳化整個神經網路。本文以資產配置中的風險預算模型為例,測試了基於神經網路的組合最佳化效果。在合理限制下,模型在兩組資產配置測試中均能獲得更好的收益表現。
CvxpyLayers能突破傳統組合最佳化方法的侷限
相對於因子生成和多因子合成,傳統組合最佳化方法是一個獨立的過程,不能傳播梯度,因此無法藉助神經網路進行端到端的最佳化,可能會有以下侷限:(1)無法透過端到端的方式影響到組合最佳化的輸入(如預期收益、風險預算);(2)組合最佳化中的引數(如風險厭惡係數)只能透過遍歷的方式來確定;(3)一般只進行單期最佳化。CvxpyLayers在Cvxpy的基礎上,將凸最佳化過程作為網 絡層嵌入到神經網路中,使得梯度傳播成為可能,從而具有突破以上侷限的潛力。CvxpyLayers專案目前由斯坦福大學凸最佳化研究組維護。
本文介紹了三個使用CvxpyLayers進行組合最佳化的案例及程式碼
針對量化投資可能涉及的不同組合最佳化場景,本文介紹了三個使用CvxpyLayers進行組合最佳化的案例,並提供相關問題的凸最佳化形式證明。具體包含:(1)Softmax函式的凸最佳化形式;(2) 風險預算模型的凸最佳化形式;(3)馬科維茨模型。其中Softmax函式和風險預算模型的凸最佳化形式均採用 拉格朗日乘子法進行證明。本文也給出了以上三個案例的樣例程式碼。
本文介紹了基於CvxpyLayers的風險預算模型構建細節
實證方面,本文構建了兩個基於CvxpyLayers的風險預算模型:(1)因子模型FactorModel:人工構建大類資產因子,然後輸入神經網路對映為風險預算,再對接CvxpyLayers最佳化得到資產權重。FactorModel整合了因子合成和組合最佳化兩個步驟。(2)端到端模型LSTMModel:直接將大類資產的原始日頻收益率資料輸入神經網路的LSTM層對映為風險預算,再對接CvxpyLayers最佳化得到資產權重。兩個模型都以最大化組合收益作為預測目標,並透過反向傳播動態學習更優的風險預算。LSTMModel整合了因子挖掘、因子合成和組合最佳化三個步驟。
基於CvxpyLayers的模型在兩組資產配置測試中均能獲得更好的收益表現
我們選取國內外比較典型的股票、債券、商品大類資產指數,測試基於CvxpyLayers的風險預算模型在國內外資產配置和國內資產配置的表現,對比基準為風險平價模型。在對風險預算的上下限進行合理限制後,FactorModel和LSTMModel均能相對基準獲得更好的收益表現。我們進一步分析LSTMModel的超額收益來源,可知在國內外資產配置中,標普500和彭博貴金屬子指數的偏配是主要的超額收益來源;在國內資產配置中,中證500和SGE黃金9999的偏配是主要的超額收益來源。
風險提示:透過神經網路構建的資產配置策略是歷史經驗的總結,存在失效的可能。神經網路受隨機性影響較大,可解釋性較低,使用需謹慎。
將組合最佳化融入端到端的神經網路框架中
華泰金工人工智慧系列報告致力於將人工智慧方法應用於量化投資的各個流程環節。如圖表1所示,在基於因子的量化投資流程中,因子生成、多因子合成、組合最佳化是三個重要步驟。傳統的機器學習方法(遺傳規劃、隨機森林等)能針對單個步驟提供改進方案。但在分 開執行不同步驟時,可能會存在目標函式不一致、資訊損耗的問題。為了實現多個步驟的端到端(end to end)最佳化,需要藉助神經網路和深度學習。我們在《人工智慧 32:AlphaNet:因子挖掘神經網路》(2020.6.14)中構建了深度學習模型 AlphaNet,能實現端到端的因子挖掘和因子合成,但尚未將組合最佳化納入。
本文將關注如何將組合最佳化也融入到神經網路和深度學習中,從而打通量化投資的三個步驟,實現全流程的端到端最佳化。具體而言我們將藉助CvxpyLayers,在進行凸最佳化的同時傳播梯度。在一個理想的端到端神經網路框架中,輸入資產的原始資料,透過神經網路進行特徵提取和合成,再透過CvxpyLayers最佳化得到資產權重,目標函式可直接定義為資產組合的收益率或其他指標,並使用該目標函式最佳化整個神經網路。
基於神經網路的組合最佳化工具:CvxpyLayers
傳統組合最佳化方法的侷限
我們以馬科維茨模型為例,來說明傳統組合最佳化方法:
式中