【文件属性】:
文件名称:调试器:Bancolombia Dataton代码
文件大小:17.37MB
文件格式:ZIP
更新时间:2021-02-15 12:19:42
JupyterNotebook
调试器
Bancolombia Dataton代码,您可以在其中查看规则并下载为解决问题而提供的数据
您可以查看所使用的和的IDE要求
每个Bancolombia客户的家庭每月支出多少?
为了解决这个问题,我们探索了三种方法来掌握数据并制作最终数据集来训练模型
数据工程
我们首先要修复和 数据,并进行一些分类排名以将数据为目标变量,但是您可以看到一种EDA
汇总每个用户ID的所有数据
是用于实现此目标的代码。 在此过程的开始阶段,想法是根据将货币变量设置为dic-20值
每月汇总所有数据
是用于实现此目标的代码
沿时间线获取历史数据
是达到这个目标的代码
在每种情况下,我们都必须在使用 R方法估算所有缺失的值,并在验证结果
每个
每个
数据科学
要对问题建模,请按照以下步骤进行
相关分析,是在每个id的数据中完成的操作
线性回归
每个
每个
PCA
每个
每个时间轴
神经Networ
【文件预览】:
Debuggers-main
----Untitled.ipynb(35KB)
----80%()
--------Aggregate_Top_10.ipynb(300KB)
--------Aggregate_all_dataXid.ipynb(307KB)
--------Alomarrano_processing()
--------Variables definitivas.txt(495B)
--------Labeled&Dummies_Variables.ipynb(134KB)
--------Variables continuas.xlsx(10KB)
--------Numerical_Data_Engineering.ipynb(4.65MB)
--------Xid_MissingValuesAnalysis.ipynb(2.04MB)
--------Indexing_Input_Pesos_Dic_20.ipynb(58KB)
--------Categorical_Data_Engineering.ipynb(551KB)
--------del 20-30.ipynb(263KB)
--------Aggregate last 10 .ipynb(96KB)
--------Xmes_MissingValuesAnalysis.ipynb(613KB)
--------Calculo por mes.ipynb(298KB)
----R_requirements.txt(357B)
----requirements.txt(110B)
----.gitignore(2KB)
----README.md(6KB)
----20%()
--------Xmes_PCA.ipynb(341KB)
--------Modeling_GridSearchExtraTrees.ipynb(199KB)
--------Alomarrano()
--------Xid_PCA-First.ipynb(808KB)
--------LinearRegresion.ipynb(759KB)
--------NN_littlePig.ipynb(39KB)
--------Xid_PCA_Second.ipynb(817KB)
--------Xmes_LinearRegresion.ipynb(732KB)
--------Xid_LinearRegresion.ipynb(1.85MB)
--------Modeling_GridSearchExtraTrees - copia.ipynb(42KB)
----PPCA4missing_values.R(516B)