【文件属性】:
文件名称:plagiarism:抄袭检测
文件大小:49KB
文件格式:ZIP
更新时间:2021-05-24 14:03:59
Python
窃
要求:
的Python 3.3.1
pdfminer3k: ://pypi.python.org/pypi/pdfminer3k/
分发: :
nltk: :
nltk数据(停用词): ://nltk.org/data.html
bs4: ://www.crummy.com/software/BeautifulSoup/
用法:
要在Google中搜索窃的文档,请执行以下操作:
main.py localfile.txt
main.py localfile.pdf
main.py http://example.ru/somefile.txt
main.py ftp://example.com/somefile.pdf
按Ctrl-C跳过您不想测试的任何文件
比较两个文档:
main.py localfile.txt ftp://example.com/