【文件属性】:
文件名称:2018-TianChi-Double-high-Round-1:2018年天池美年双高初赛代码
文件大小:13KB
文件格式:ZIP
更新时间:2021-05-12 21:29:16
Python
2018-TianChi-Double-high-Round-1
2018年天池美年双高初赛代码
数据链接: 密码:34f7
0.make_TXT_to_PANDAS.py 将原始txt数据转化为pandas可读数据
1.wish_train_label.py 清洗数据的标签
2.clean_data_part.py 清晰0得到的数据 默认选择初赛b数据
bk_up.py 模型训练 大约3小时 默认选择清洗后的初赛b数据
运行环境详见附件:windwos10 python3.5 环境
内存需求 12g及其以上
磁盘需求 5g及其以上
线下结果大约为 0.0290x附近
思路:
数据分为 定量/定性 两个部分
定量的数据清洗主要是洗掉 类似 25 25 这样的错位数据 和 替换数据中的一些特殊字符 类似于 圆角/半圆角
对于定性的部分,主要是一些指标数据,这部分直接采用 labelencod
【文件预览】:
2018-TianChi-Double-high-Round-1-master
----README.md(1KB)
----code()
--------bk_up.py(15KB)
--------run.bat(104B)
--------2.clean_data_part.py(16KB)
--------0.make_TXT_to_PANDAS.py(2KB)
--------1.wish_train_label.py(1KB)
----运行环境的文件.txt(4KB)
----readme.txt(409B)