kaggle-caterpillar:Kaggle比赛

时间:2024-06-01 07:23:44
【文件属性】:

文件名称:kaggle-caterpillar:Kaggle比赛

文件大小:562KB

文件格式:ZIP

更新时间:2024-06-01 07:23:44

Python

Kaggle卡特彼勒试管定价挑战 此回购包含我对Kaggle竞赛的解决方案,以及我在此过程中产生的所有勘探代码。 我在私人排行榜上的得分为0.211679,在1323个参赛团队中排名第31(排名前3%),在个人参赛者中排名第13。 主要的解决方案代码在soln/ ,而探索性的IPython笔记本在exploration/ 。 我的最终模型是xgboost树模型的袋装合奏,如下面的“装袋实验”中所述。 该文件的其余部分描述了我参加比赛的方法以及我尝试过的其他想法,但并未纳入最终模型。 我假设熟悉,和。 交叉验证方法 我将训练集划分为K = 10折以进行交叉验证。 由于托架定价,对于同一tube_assembly_id ,训练集可以有多行。 但是,训练集和测试集中的tube_assembly_id是不相交的。 为了将其保留在K折中,我将唯一的tube_assembly_id拆分为K折,而不


【文件预览】:
kaggle-caterpillar-postmortem
----.gitignore(143B)
----images()
--------bracket.png(10KB)
--------fixed_costs.png(10KB)
----requirements.txt(567B)
----LICENSE.md(1KB)
----soln()
--------combine_bags.py(646B)
--------experts.py(4KB)
--------train_all_bags.sh(280B)
--------dummy.py(75B)
--------__init__.py(0B)
--------dump_xv_folds.py(2KB)
--------train_bag.py(3KB)
--------utils.py(5KB)
--------bracket.py(3KB)
--------expert_params.py(4KB)
--------dataset.py(21KB)
--------optimize_params.py(5KB)
--------predict_on_test.py(2KB)
----make_figures_for_readme.ipynb(31KB)
----README.md(15KB)
----exploration()
--------random_forests.ipynb(297KB)
--------xgboost.ipynb(59KB)
--------check_featurizer.ipynb(106KB)
--------elbow_cluster.ipynb(42KB)
--------others_xgboost.ipynb(17KB)
--------xv_eval_xgboost.ipynb(9KB)
--------optimize_for_empty_bracket.ipynb(46KB)
--------feature_ranges.ipynb(52KB)
--------experts_v2.ipynb(36KB)
--------instance_weighting.ipynb(6KB)
--------ensemble.ipynb(12KB)
--------bracket_pricing_3.ipynb(61KB)
--------xv_eval.ipynb(12KB)
--------hyperopt_results.ipynb(30KB)
--------check_results.ipynb(31KB)
--------explore_data.ipynb(67KB)
--------straight_cluster.ipynb(145KB)
--------bracket_pricing_2.ipynb(128KB)
--------bracket_pricing.ipynb(680KB)
--------bagging.ipynb(11KB)
--------identical_tubes.ipynb(22KB)
--------look_for_experts.ipynb(9KB)
--------components.ipynb(117KB)
--------optimize_for_unknown_components.ipynb(68KB)

网友评论