attn2d:普遍注意:2D卷积网络用于序列到序列的预测

时间:2021-02-03 18:14:28
【文件属性】:
文件名称:attn2d:普遍注意:2D卷积网络用于序列到序列的预测
文件大小:1.19MB
文件格式:ZIP
更新时间:2021-02-03 18:14:28
nlp pytorch nmt NaturallanguageprocessingPython 这是Fairseq(-py)的一个分支,具有以下模型的实现: 普遍注意-二维卷积神经网络用于序列到序列的预测 NMT通过二维卷积模型对源序列和目标序列进行联合编码。 Pervasive Attention还提供了广泛的解码网格,我们可以利用该网格有效地训练wait-k模型。 请参阅。 同步机器翻译的高效Wait-k模型 具有单向编码器并联合训练多个wait-k路径的Transformer Wait-k模型(Ma等,2019)。 请参阅。 Fairseq要求和安装 版本> = 1.4.0 Python版本> = 3.6 要训​​练新型号,您还需要NVIDIA GPU和 要安装fair

网友评论