文件名称:virgin_twitter_TFIDF_analysis:使用TFIDF的原始航空公司推文分析
文件大小:1.08MB
文件格式:ZIP
更新时间:2024-03-05 03:54:19
virgin_twitter_TFIDF_analysis 原始航空公司使用TFIDF进行推文分析 资料来源:Kaggle资料集 网址: : 目的: 对相关单词使用TF-IDF数据处理和特征提取 使用推文数据集训练MLlib中的不同分类回归模型。 使用训练有素的模型来确定哪些绩效更好。 要求: 安装了Spark 客观的 : 使用TF-IDF数据处理和特征提取来识别文本中更相关的单词 执行步骤以提取特征并标记并提交给分类回归模型。 演示使用MLlib库的不同方法。
【文件预览】:
virgin_twitter_TFIDF_analysis-master
----spark-MLlib-TF-IDF-virgin-airlines-twitter-analysis.txt(8KB)
----virgin-twitter()
--------virgin-tweets.csv(3.26MB)
----README.md(709B)