maleo:包装程序库,用于NLP中的文本清理和预处理

时间:2024-05-20 20:11:42
【文件属性】:

文件名称:maleo:包装程序库,用于NLP中的文本清理和预处理

文件大小:96KB

文件格式:ZIP

更新时间:2024-05-20 20:11:42

nlp machine-learning nlp-library indonesian-language Python

马莱诺 包装程序库,用于NLP中的文本清洗,预处理和POS标记 文件 功能概述 - Scanner : get insight about your text dataset (ex: number of chars, words, emojis, etc) - Remove hyperlink, punctuation, stopword, emoticon, etc - Extract hashtags, price from text - Convert email, phone number, date to - Convert Indonesian slang to formal word - Convert emoji to word or - Convert word to number - Predict Part-of-Speech (POS) t


【文件预览】:
maleo-master
----.gitignore(47B)
----setup.cfg(39B)
----README.md(1KB)
----logo.png(23KB)
----LICENSE(1KB)
----maleo()
--------scanner()
--------stopword_remover()
--------pos_tag()
--------wizard()
--------__init__.py(124B)
--------cleansing()
--------documentation.md(867B)
--------preprocessing()
----requirements.txt(139B)
----setup.py(1KB)

网友评论