【文件属性】:
文件名称:attn2d:普遍注意:2D卷积网络用于序列到序列的预测
文件大小:1.19MB
文件格式:ZIP
更新时间:2021-02-03 18:14:28
nlp pytorch nmt NaturallanguageprocessingPython
这是Fairseq(-py)的一个分支,具有以下模型的实现:
普遍注意-二维卷积神经网络用于序列到序列的预测
NMT通过二维卷积模型对源序列和目标序列进行联合编码。
Pervasive Attention还提供了广泛的解码网格,我们可以利用该网格有效地训练wait-k模型。
请参阅。
同步机器翻译的高效Wait-k模型
具有单向编码器并联合训练多个wait-k路径的Transformer Wait-k模型(Ma等,2019)。
请参阅。
Fairseq要求和安装
版本> = 1.4.0
Python版本> = 3.6
要训练新型号,您还需要NVIDIA GPU和
要安装fair