ijcai_2018:ijcai_2018排名60

时间:2021-05-19 05:17:18
【文件属性】:
文件名称:ijcai_2018:ijcai_2018排名60
文件大小:12KB
文件格式:ZIP
更新时间:2021-05-19 05:17:18
Python ijcai_2018 ijcai_2018 复赛排名 60 比赛赛题链接: 主要思路如下: 1.用7号早上的数据作为训练和本地验证,用31-6号的数据提取历史统计特征 2.用7号当天的数据提取统计转化率等特征,用户点击行为,商品,店铺的特征,以及类目属性等的特征,但因为上午的样本分布存在差异,因此对此做了 模型权重的调整,按照线上与线下的比例调整模型的权重,或者对数据做一定处理。 3.leak特征,包括用户下一次点击的时间差,以及用户点击的时间顺序,用户是否是第一次点击,是否是最后一次点击,由此延伸出来是否用户是否第一次, 最后一次点击某商品,是否第一次点击,最后一次点击某类目等等,包括与最后一次点击的时间差。 4.lgb单模型 不足: 1.电脑只有16G,没有处理大量数据的经验,不能很好挖掘31-6号的历史行为特征 2.对用户的兴趣行为,包括类目属性和预测的类目属性,等等都没有做深入挖掘
【文件预览】:
ijcai_2018-master
----gen_data.py(5KB)
----feature_model.py(23KB)
----.idea()
--------misc.xml(213B)
--------ijcai_2018.iml(459B)
--------modules.xml(272B)
--------vcs.xml(180B)
----leak_feature.py(8KB)
----gen_cvr_smooth.py(1KB)
----README.md(2KB)
----count_feature.py(4KB)

网友评论