【文件属性】:
文件名称:domain-adaptation-data
文件大小:11KB
文件格式:ZIP
更新时间:2021-05-13 16:16:10
这些数据来自OPUS( )。
来自5个域的数据:
法律(JRC-Acquis),医疗(EMEA),IT(GNOME,KDE,PHP,Ubuntu和OpenOffice),可兰经(Tanzil)和字幕(OpenSubtitles)。
如果您使用任何数据,请引用OPUS,也请链接到单个数据源:
作品:
@InProceedings{TIEDEMANN12.463,
author = {J\"org Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {20
【文件预览】:
domain-adaptation-data-master
----koran-dev.de.tgz(130B)
----subtitles-dev.de.tgz(130B)
----subtitles-train.en.tgz(134B)
----acquis-train.de.tgz(133B)
----it-dev.de.tgz(130B)
----emea-test.de.tgz(130B)
----koran-test.de.tgz(130B)
----koran-train.de.tgz(133B)
----koran-train.en.tgz(133B)
----acquis-test.de.tgz(130B)
----subtitles-test.de.tgz(130B)
----emea-train.de.tgz(133B)
----acquis-dev.de.tgz(130B)
----koran-dev.en.tgz(130B)
----subtitles-train.de.tgz(134B)
----emea-dev.en.tgz(130B)
----acquis-dev.en.tgz(130B)
----it-train.en.tgz(132B)
----emea-train.en.tgz(133B)
----README.md(4KB)
----subtitles-test.en.tgz(130B)
----it-train.de.tgz(132B)
----it-test.de.tgz(130B)
----koran-test.en.tgz(130B)
----acquis-test.en.tgz(130B)
----.gitattributes(41B)
----it-dev.en.tgz(130B)
----it-test.en.tgz(130B)
----acquis-train.en.tgz(133B)
----emea-dev.de.tgz(130B)
----emea-test.en.tgz(130B)
----subtitles-dev.en.tgz(130B)