- A+
领500g书库,关注公众号:程叫兽的宝藏 (长按可复制!)
热门下载区==>点此链接进入<<<
目录(点击切换)
本文节选自《因子投资相关论文》
练神经网络时,和常用的方法是通过最小化预测误差的L2范数形式惩罚项来估计权重参数。相比于前面介绍的决策树方法,神经网络的优势在于在每一步训练中可以同时更新所有的模型参数。但神经网络的高度非线性特征和巨大的参数量,使得其计算非常复杂,且需要更多的正则化处理以避免过拟合。为解决这些问题,随机梯度下降〈stochasticgradientdescent,SGD)方法常常被用来训练神经网络。它通过牺牲一定的精度换取计算效率的大幅提升。除此之外,诸多正则化方法也被引入来解决过拟合的问题,它们包括学习率收缩〈learningrateshrinkage)、提前停止〈earlystopping)、批标准化〈batchnormalization)和集成学习Censembles)。近年来,深度学习又有了进一步的发展,先后出现了深度前馈神经网络(deep”feed-forwardneuralnetworks,DFN)、循环神经网络〈recurrentneuralnetworks,RNN)和长短期记忆模型〈longshort-termmemory,LSTM)等。6.8.3”模型评估与实证研究如何评估模型是将机器学习算法应用于因子投资中的妃一个重要问题。弟用方法是分析预测模型的样本外可决系数ws,它的定义如下:(Rati一已1)2Raos=1--机盖(Ri一珊)(6.32)其中Rosa和局分别为资产;在寻1期的真实收益和预测收益率,玉则表示大资产;的历史平均收益。因此,式《6.32)衡量的是相对于历史均值预测,该模型是否有要修罗生机多广队天。当模型预测结果不如历史均值时,根据《〈6.32)定义的Roos/人。WelchandGoyal(2008)和CampbellandThom
因子投资电子版
pson(2008)使用〈6.32)为依据检验了诸多变量对市场总体收益率的预测能力。然而对于预测个股收益而言,历史均值预测往往表现非常粳糕。因此,Guetal.〈2020)指出应用零代蔡历史均值预测作为预测基准。相应地,R2,.变为:Ra1es|(6.33)总为入条实证分析结果显示,阁采用历史均值预测作为基准,则所有候选模型的R。都会上升大约3%。一般来说,预测模型的样本外rs。超过0.5%就表明该模型是有价值的。因此,如果在评佑个股收益预测模型时使用历史均值作为基准,很可能得到具有误导性的结论。除此之外,Guetal.〈2020)还进一步参照DieboldandMariano(2002)构建了形如〈6.34)的统计量,用来比较不同预测模型两两之间的相对表现。假设竺评估的模型为横型1和模型2,该统计量定义为:(6.34)上式中X为样本外的股票数量,思为两个模型在样本外的均方误差的差异,而mm和款,分别为do的均值和均值的标准误,尖,me分别为两个模型对于股票;的预测误差。由定义可知,DMhi越大,表明模型1相对模型2表现越差,反之则表明模型1相对模型2表现更好。基于从19$7到2016年的长达60年的美股数据,Gnuetal.〈2020)仔细研究了不同模型的表现。他们考虑了94种公司特征和8个宏观变量及它们的交互项,并另有74个行业分类,得到总共94x〈8+1)+74=920个特征。在此基础上,该文比较了13个预测模型,包括6个线性模型算法〈即包含全部特征的OLS回归,只包含规模、账面市值比和动量的OLS回归、PLS、PCR、弹性网络,以及广义线性回归)、2个树模型〈随机森林和GBDT)以及5$个神经网络模型〈分别包含1到$层隐藏层),且对于OLS、弹
因子投资中FM回归的自变量
性网络、人从全样本来看,OLS的表现非常糟糕〈且对大盘股而言更是如此)。而只考虑三个特征的OLS,或者弹性网络等方法,通过添加额外的惩罚项,表现得到了品的提升。此外,GBDT和随机森林表现也不错。然而在众多模型中,表现最好的非线性模型还要数神经网络模型,尤其是带3层隐藏层的神经网络模型。当采用样本外Re为评价标准时也有类似的结果。除此之外,模型间的两两配对比较则有如下发现:所有带约束的线性模型的表现都显著优于普通OLS,而在降维方法(PLS/PCR)和惩罚性回归模型的表现则没有明显差异;树模型表现相比线性模则而经条但莹异并不显著,神经网络表现显者优于儿性贷型,但相对桂懂型的改}册个显著。除了比较不同模型的表现外,Guetal.〈2020)的实证分析还有另外一个重要作用,即比较不同特征对于股票定价的重要性。该文将所有公司特征分为四大类:趋势类特征《例如各种动量和短期反转)、和流动性有关的特征、风险测度指标,以及基本面特征。他们发现线性模型普遍高度倾癌趋势类特征,而非线性模型则会较为平均地关注多种公司特征。总体而言,趋势类特征的影响最为显著。除上述针对美股的代表性研究外,近些年也有不少学者研究了机器学习算法在中国A股市场的表现,并有类似的发现。总体而言,带约束的线性模型表现优于OLS,非线性模型义优于线性模型。在非线性模型中又尤其以深度前馈神经网络(CDFN)和XGBoost表现非党出色。此外,利用集成学习整合不同模型也可以进一步提升模型表现。而在特征重要性方面,已有研究表明,在A股市场中最为重要的因子是交易摩擦类〈流动性)相关因子,这与美股市场有所不同。6.8.4主成分分析和因子选择近年来,一些新的研究将无监督学习算法引入实证资产定价和因子投资,用
因子投资的模型论文
| 因子投资方法与实践 百度网盘 | 因子投资策略构建代码 |
| 因子投资方法与实践pdf | 因子投资电子版 |
| 因子投资静电书籍 | 因子投资方法与实践pdf |
综上:因子投资简介值得推荐阅读

