文件名称:maleo:包装程序库,用于NLP中的文本清理和预处理
文件大小:96KB
文件格式:ZIP
更新时间:2024-05-20 20:11:42
nlp machine-learning nlp-library indonesian-language Python
马莱诺
包装程序库,用于NLP中的文本清洗,预处理和POS标记
文件
功能概述
- Scanner : get insight about your text dataset (ex: number of chars, words, emojis, etc)
- Remove hyperlink, punctuation, stopword, emoticon, etc
- Extract hashtags, price from text
- Convert email, phone number, date to
【文件预览】:
maleo-master
----.gitignore(47B)
----setup.cfg(39B)
----README.md(1KB)
----logo.png(23KB)
----LICENSE(1KB)
----maleo()
--------scanner()
--------stopword_remover()
--------pos_tag()
--------wizard()
--------__init__.py(124B)
--------cleansing()
--------documentation.md(867B)
--------preprocessing()
----requirements.txt(139B)
----setup.py(1KB)