RNN存在梯度消失和爆炸的问题
更新日期:2021-09-02     浏览次数:106
核心提示:1 TCN算法原理循环神经网络也有不足之处,当输入的序列长度过大时,将会产生严重的梯度消失或爆炸问题。在2018年,Bai等[10]使用时域卷积神经网络结构

1  TCN算法原理

循环神经网络也有不足之处,当输入的序列长度过大时,将会产生严重的梯度消失或爆炸问题。在2018年,Bai等[10]使用时域卷积神经网络结构证明了该网络在序列建模任务中也能表现出优异的性能。TCN是时间卷积网络(Temporal Convolutional Network,TCN)的简称,主要由残差块组成,与传统RNN相比TCN的优势主要体现在:①实现并行处理。给定输入时不用像RNN一样顺序处理;②感受野的灵活调整。TCN能够轻易改变感受野的大小,以此获得更多的输入;③拥有较为稳定的梯度。RNN存在梯度消失和爆炸的问题,但是TCN基本不会出现。

膨胀卷积在因果卷积的基础上改良,目的是减少因感受野不断扩大导致的卷积层数增加带来的梯度消失、训练复杂等问题。在因果卷积中,上一卷积层t时刻的值,只能依赖于下一卷积层t时刻和t时刻之前的值。因此,因果卷积是单向结构,不能看到未来的数据,是一种严格的时间约束模型。但其有致命的问题,如果需要更长时间的输入特征,那么卷积层的层数将会变得异常庞大。