Sephora-review-analysis:我们将使用网络爬虫和nltk分析丝芙兰的客户评论

时间:2024-05-18 02:08:03
【文件属性】:

文件名称:Sephora-review-analysis:我们将使用网络爬虫和nltk分析丝芙兰的客户评论

文件大小:3KB

文件格式:ZIP

更新时间:2024-05-18 02:08:03

Python

描述 该程序在丝芙兰评论页面上爬网文本,并返回评论ID,评分,评论者的名字和位置,他们的评论文字以及有多少人认为他们的评论有用。 所需的图书馆 在命令提示符下使用以下pip命令安装必要的库。 pip3 install requests pip3 install lxml pip3 install beautifulsoup4 pip3 install nltk 待办事项清单 项目按重要性顺序列出。 创建一个地图,显示各州的评论频率和评分 筛选出标签和people在array_helpful(也许尝试使用替代()) 解决的问题 最新修复程序列在首位。 修复了错误“索引超出范围”。 第一次(最早的)评论没有评分,因此我们将在数据集中忽略此1个实体。 停止跳过隐藏的段落(当评论很长并且您必须单击“查看更多”时,搜寻器将跳过这些部分) 修复rating开头的5、4、3、


【文件预览】:
Sephora-review-analysis-master
----sephora.py(3KB)
----README.md(1KB)
----ServerTest.py(252B)
----comment_analysis.py(1KB)

网友评论