文件名称:pymystem3:Yandex Mystem 3.1形态分析器(http
文件大小:29KB
文件格式:ZIP
更新时间:2024-06-03 06:29:44
language yandex morphology tagging pos
Yandex Mystem 3.1形态分析器的Python包装器 介绍 该模块包含用于2014年6月发布的俄语优秀形态分析器的包装。形态分析器可以对文本进行词素化,并为每个标记导出一组形态学属性。 有关该算法的更多详细信息,请参见I. Segalovich MLMTA-2003,美国内华达州拉斯维加斯,它。 Python是许多计算语言学家(包括那些使用俄语工作的语言学家)选择的语言。 进行此开发的主要动机是,没有Mystem的任何Python包装器,Mystem是俄罗斯语言中最受欢迎的词法分析器之一,以及 , 和 。 Mystem的第三个版本引入了一些重要的改进,大部分是词性歧义消除。 我们的包装程序在执行POS歧义消除的模式下运行Mystem。 该包装器是MIT许可下的开放源代码。 但是,请注意,Yandex Mystem不是开源的,并且在“ 条件下。 系统装备 包装器可与CPy
【文件预览】:
pymystem3-master
----MANIFEST.in(498B)
----.travis.yml(176B)
----README.rst(4KB)
----requirements-dev.txt(331B)
----docs()
--------make.bat(5KB)
--------Makefile(6KB)
--------source()
----pavement.py(7KB)
----tests()
--------test_mystem.py(599B)
----tox.ini(661B)
----LICENSE(1KB)
----setup.cfg(186B)
----requirements.txt(9B)
----setup.py(8KB)
----.gitignore(2KB)
----bench.py(3KB)
----.ppt-version(339B)
----.editorconfig(435B)
----pymystem3()
--------constants.py(813B)
--------metadata.py(686B)
--------__main__.py(540B)
--------mystem.py(14KB)
--------__init__.py(300B)