【文件属性】:
文件名称:mockingbird:编程语言分类器
文件大小:26KB
文件格式:ZIP
更新时间:2021-05-18 08:30:40
Go
知更鸟
介绍
的Go分类器。
语言学家可以通过以下方式用作Go软件包
import "github.com/lazywei/linguist"
并且在cli/
$ cd cli/
$ ./build.sh
$ ./mockingbird --help
命令行界面用法
准备LIBSVM格式数据集
收集罗塞塔代码
克隆
git clone git@github.com:acmeism/RosettaCodeData.git
构建此cli可执行文件
cd cli/
./build.sh
运行collectRosetta根据克隆RosettaCodeData,并收集文件../samples
./mockingbird collectRosetta path/to/clones/RosettaCodeData ../samples
建立单词袋并将示例转换为Libsvm
从头开始
【文件预览】:
mockingbird-master
----.gitignore(64B)
----tokenzier.go(3KB)
----classifier.go(4KB)
----cli()
--------utils.go(1KB)
--------collect_rosetta.go(1KB)
--------main.go(4KB)
--------convert_libsvm.go(4KB)
--------build.sh(36B)
----.travis.yml(572B)
----scanner()
--------scanner.go(2KB)
--------scanner_test.go(4KB)
--------scanner_suite_test.go(194B)
----License.md(1KB)
----README.md(2KB)
----tokenzier_test.go(9KB)
----test_fixture()
--------test_samples()
--------test_samples.libsvm(777B)
----classifier_test.go(3KB)
----logistic_regression_test.go(1KB)
----logistic_regression.go(2KB)
----mockingbird_suite_test.go(206B)