QRNN(Quasi-Recurrent Neural Networks)

QRNN为LSTM加速算法,模型结构如下:
QRNN(Quasi-Recurrent Neural Networks)

qrnn第一层为卷积层,用于提取输入特征,第二层为pooling层,用于减少特征数目,但语常用的pooling层不同的是,qrnn采用fo-pool方法,具体计算如下.

卷积层:

对于输入X,分别通过三个卷积层和非线性层得到Z,F,O,公式如下:

Z=tanh(Wz∗X)

F=σ(Wf∗X)

O=σ(Wo∗X)

这里Wz,Wf,Wo为Rkxnxm 大小的卷积滤波器,当滤波器宽度为2时,上述公式可以表示如下:

Z=tanh(W1z∗Xt−1+W2z∗Xt)

F=σ(W1f∗Xt−1+W2f∗Xt)

O=σ(W1o∗Xt−1+W2o∗Xt)

即滤波器的宽度越大.越能计算更高的n-gram特征,因此为了考虑更多时刻的特征,可以适当增加滤波宽度.

ht=ft∗ht−1+(1−ft)∗zt

ct=ft∗ct−1+(1−ft)∗zt

ht=ot∗ct

it为一个独立的输入

ct=ft∗ct−1+it∗zt

ht=ot∗ct

在每种情况下,初始化h,c为0.

GTMM