时间序列问题上的可解释机器学习的benchmark方法 | 首都客運時刻表查詢網
![时间序列问题上的可解释机器学习的benchmark方法](https://i.imgur.com/2oxSoeJ.png)
2020年11月22日—简要的概括下就是给你一模型和一个含多变量的时间序列样本,你需要输出这个样本不同时刻不同特征上的重要性。4现存的SaliencyMethod在时间序列问题上 ...
![时间序列问题上的可解释机器学习的benchmark方法](https://i.imgur.com/2oxSoeJ.png)
今天这篇文章介绍一篇机器学习可解释的文章,该篇文章主要提出了一种时间序列问题上的机器学习可解释方法的benchmark。文章链接:
https://arxiv.org/abs/2010.13924
虽然目前可解释方法研究不成熟,但本篇文章我个人觉得还是比较有意思的,值得一看。由于本人在可解释机器学习上积累不多,文章读起来有些吃力,文章中对目前一些可解释方法的分析部分比较难理解(很多地方我也是带着猜测理解的),但文章的核心方法很好理解。后文将会介绍本人对这篇文章的理解,可能会与原文内容有所偏差,敬请谅解。
1 机器学习可解释重要性目前在很多领域中机器学习深度学习已经应用的非常广泛了。但在量化投资、风控等领域,对机器学习的应用一直保持着谨慎的态度,其主要原因还是人无法理解较为复杂的机器学习模型。
我在刚开始研究量化时,对于风控的理解就不深,总以为只要回测表现的很好,就可以上实盘或模拟盘检验你的模型。我自己也试验过几个模型,有一些模型跑了一段时间表现很差,这也让我很困惑为什么回测表现还可以,模拟盘表现的这么差。随着对量化的深入研究,我越来越意识到在上模拟盘之前我们需要去理解你的模型买卖逻辑是怎么样的。这样能够减少检验次数,除此之外一旦出现实盘或者模拟盘表现不好你就会知道这种情况是正常的回撤还是模型已经失效,也能根据对市场的理解调整一个模型。
一个好的可解释机器学习的模型可以帮助你更好的理解你的模型在决策时更关注哪些特征,而你在这理解的过程中也会明白你的模型买卖逻辑,也能根据这个买卖逻辑去优化你的模型。这个买卖逻辑也能增强你对交易的理解,我现在越发觉得想做好量化交易,自己得会交易!
总而言之,对于机器学习的可解释是非常有必要的。
2 一些背景知识Saliency Methods(可解释机器学习的方法)主要可以分为三类,一类是基于梯度的方法,另一类就是基于扰动的方法,还有一类是主要是以shap计算为主的方法。
1)...