文件名称:kemangi:印尼语文字预处理器
文件大小:141KB
文件格式:ZIP
更新时间:2024-05-24 10:37:18
Java
罗勒 印尼语的简易文本预处理器 也称为印尼语。 概述 基于Java的应用程序可以预处理您的印尼语文本,以进行其他更智能的工作,例如文本挖掘。 某些功能会消耗提供的Web服务。 例子 原始文字: Mempermainkan peranan 12 domba di pementasan ALAyISME iTu TETAP ada di Jakarta Saya tidur... kemarin Pin BB saya B12A3FC bbm koq naik, warga sedih #edisicurhat dia memblokir website http://www.lucu.com éà ada karakter ga jelas, non ASCII appeared! #wow Pak kepala desa tidak tahu bahwa 3 pencuri di
【文件预览】:
kemangi-master
----.gitignore(39B)
----README.md(3KB)
----pom.xml(3KB)
----docs()
--------make.bat(7KB)
--------source()
--------Makefile(7KB)
----sample-files()
--------own-stopword.txt(25B)
--------test-input.txt(336B)
----kemangi.iml(6KB)
----src()
--------test()
--------main()
----LICENSE.txt(1KB)