【文件属性】:
文件名称:Ant_Tianchi_CCF_Positioning:2017CCF大数据与计算智能大赛-蚂蚁金服-商铺定位赛题(全国第5名)
文件大小:21KB
文件格式:ZIP
更新时间:2021-04-29 05:13:40
JupyterNotebook
Ant_Tianchi_CCF_Positioning
2017CCF大数据与计算智能大赛-蚂蚁金服-商铺定位赛题(第5名)
赛题链接
文件说明
getFeatures.sql为二分类部分预处理与得到特征中间文件处理,之后再在PAI平台上搭建组件让每个特征文件和构建的样本join起来,多分类部分由队友负责
wifiFingerprint.ipynb为初赛的python版构建指纹库及计算指纹得分,复赛java实现在udtf中
udtf为getFeatures用到的几个udtf方法
xgb_train.sql为PAI平台的xgboost命令(平台没有xgboost的拖拽组件,只能用PAI命令)
submission.sql为提交结果部分,包括最佳成绩的加权平均
训练说明:
7.1-8.17做8.18-8.31统计区间,7.15-8.31做9.1-9.14测试集的统计区间
复赛有约38%的数据没
【文件预览】:
Ant_Tianchi_CCF_Positioning-master
----getFeatures.sql(98KB)
----udtf()
--------wifiFingerbase.java(2KB)
--------getFingerscore.java(3KB)
--------splitWifi.java(935B)
--------splitFeats.java(768B)
----wifiFingerprint.ipynb(9KB)
----README.md(5KB)
----submission.sql(4KB)
----xgb_train.sql(15KB)