文件名称:Microsoft-Malware-Classification-Challenge:击败 Microsoft 恶意软件分类挑战 (BIG 2015) 的基准
文件大小:4KB
文件格式:ZIP
更新时间:2024-07-14 03:07:14
Python
Microsoft-恶意软件-分类-挑战 击败 Microsoft 恶意软件分类挑战 (BIG 2015) 的基准 嗨,Kagglers, 这是我在排行榜上得分为 0.1826662 的解决方案的 github 存储库。 解决方案很简单,烦人的部分是数据准备。 它仅使用 .byte 文件来预测类别。 它计算两字节代码(00 到 FF)的频率以及 ?? 并使用该信息进行预测。 在使用这些文件之前,您必须执行以下步骤: 从训练和测试 7z 中提取 .byte 文件 Gzip .byte 文件到 .byte.gz 格式并移动到 train_gz / test_gz 文件。 我知道这两个步骤会花费很多时间,对我来说是 6 个小时。 :) 一旦你有 10868 个训练文件和 10873 个 gz 格式的测试文件,运行以下命令 python data_consolidation.py Py
【文件预览】:
Microsoft-Malware-Classification-Challenge-master
----solution.py(3KB)
----data_consolidation.py(3KB)
----README.md(980B)