文件名称:fake_news_TFIDF_analysis:使用TFIDF分析进行假新闻预测
文件大小:29.01MB
文件格式:ZIP
更新时间:2024-03-05 04:11:38
fake_news_TFIDF_analysis 使用TFIDF分析进行假新闻预测 资料来源:Kaggle资料集 网址: : 目的: 阿拉伯联合酋长国TF-IDF数据处理和相关单词的特征提取 使用新闻数据集来训练MLlib中的不同分类回归模型。 使用训练有素的模型来确定哪些绩效更好。 要求: 安装了Spark 客观的 : 使用TF-IDF数据处理和特征提取来识别文本中更相关的单词 执行步骤以提取特征并标记并提交给分类回归模型。 演示使用MLlib库的不同方法。
【文件预览】:
fake_news_TFIDF_analysis-master
----README.md(706B)
----fake_news()
--------Fake.csv.bz2(16.65MB)
--------True.csv.bz2(12.35MB)
----spark-MLlib-TF-IDF-fake-news-analysis.txt(8KB)