【文件属性】:
文件名称:NLP-Binary-Classification-Machine-Learning
文件大小:866KB
文件格式:ZIP
更新时间:2021-04-21 09:35:23
JupyterNotebook
数据源
在第四周,我们了解了一些不同的分类器。 在第五周中,我们将学习网络抓取,API和自然语言处理(NLP)。 该项目将测试这些技能。
在这个项目中
使用API从两个子收集帖子。 使用NLP训练分类器,以预测给定帖子的原始分类。 (二进制分类问题。)
结构
数据采集
数据清理和EDA
造型
具有所有必要数据的数据集。
以PDF形式展示项目。
系统要求
必要的可交付成果/提交
代码和执行摘要必须放在明确注释的Jupyter Notebook中。
您必须提交幻灯片。
资料必须在12月4日(星期五)美国东部标准时间晚上11:59之前提交。
演示文稿必须在12月4日(星期五)美国东部标准时间上午10:30之前准备好。
我彻底遵守了数据科学过程
问题陈述
数据采集
数据清理和EDA
预处理和建模
评估与概念理解
结论与建议
【文件预览】:
NLP-Binary-Classification-Machine-Learning-main
----2_Data_Cleaning_EDA.ipynb(198KB)
----Presentation.pdf(912KB)
----3_Modeling.ipynb(252KB)
----1_Data_Collection.ipynb(12KB)
----README.md(1KB)
----.gitignore(0B)