爬虫工具,用于获取平行语料

时间:2018-05-18 16:16:06
【文件属性】:

文件名称:爬虫工具,用于获取平行语料

文件大小:3.87MB

文件格式:BZ2

更新时间:2018-05-18 16:16:06

爬虫

通过爬得的网页来获取平行网页,java语言开发的,开源


网友评论

  • 下载下来是PupSniffer-1.2.tar.bz2 文件,看介绍应该满足需求。 可以在线爬语料库也可以爬本地的。