为特征工程和机器学习准备数据:特征工程技术

时间:2021-02-19 00:04:04
【文件属性】:
文件名称:为特征工程和机器学习准备数据:特征工程技术
文件大小:10.84MB
文件格式:ZIP
更新时间:2021-02-19 00:04:04
JupyterNotebook 为功能工程和机器学习准备数据 特征工程技术 无论如何设计和实施良好的机器学习模型,如果输入的数据设计不良,模型的预测将令人失望。 在此回购中,为特征工程和机器学习准备数据,您将能够对数据进行适当的预处理(实际上是对其进行工程设计),以便从ML模型中获得最大的收益。 首先,您将学习如何使用特征选择技术来查找包含最多信息的预测变量。 特征选择可以大致分为三类,分别称为过滤器,包装器和嵌入式技术,我们将理解并实现所有这些。 接下来,您将发现特征提取与特征选择有何不同,因为数据实际上被重新表达,有时以难以解释的形式表达。 然后,您将了解从图像和文本数据中提取特征的技术。 最后,您将通过了解如何利用功能强大的Python库处理图像,文本,日期和地理空间数据来完善自己的知识。 完成本课程后,您将具有识别正确的要素工程技术的技能和知识,以及适用于您的用例的解决方案。
【文件预览】:
Preparing-Data-for-Feature-Engineering-and-Machine-Learning-master
----Untitled.ipynb(555B)
----m4-demo-03-ExtractingTextFromImagesUsingOCR.ipynb(1.35MB)
----m3-demo-02-ComputingAndVisualizingFeatureCorrelations.ipynb(258KB)
----05()
--------exploring-feature-extraction-techniques-slides.pdf(1.04MB)
----m4-demo-05-WorkingWithGeospatialData.ipynb(67KB)
----06()
--------implementing-feature-extraction-slides.pdf(494KB)
----m4-demo-02-FeatureExtractionFromImages.ipynb(4.8MB)
----m2-demo-02-HandlingOutliers.ipynb(131KB)
----m3-demo-01-FeatureSelectionUsingMissingValueRatio.ipynb(32KB)
----m3-demo-03-PerformingFeatureSelection.ipynb(112KB)
----m2-demo-01-HandlingMissingValues.ipynb(29KB)
----m4-demo-01-TokenizationNormalizationAndVectorizationOfTextData.ipynb(122KB)
----04()
--------understanding-and-implementing-feature-selection-slides.pdf(772KB)
----sift_pisa_keypoints.jpg(170KB)
----m2-demo-03-ReadAndExploreTheDataset.ipynb(186KB)
----README.md(1KB)
----02()
--------demos()
----m4-demo-04-WorkingWithDates.ipynb(118KB)
----03()
--------preparing-data-for-machine-learning-slides.pdf(1023KB)

网友评论