【文件属性】:
文件名称:TF-IDF结合余弦相似度做相似度分析-python数据分析与自然语言处理
文件大小:2.48MB
文件格式:PPT
更新时间:2021-04-23 04:06:17
python 数据分析 自然语言处理
TF-IDF结合余弦相似度做相似度分析
TF-IDF
优点:简单快速,结果比较符合实际情况。
缺点:以“词频”“权重”衡量一个词的重要性,仍不够全面
可能一话的词的先后顺序也会影响词语句的表达,TF-IDF无法体现
词的位置信息,出现位置靠前的词与出现位置靠后的词,都被视为
重要性相同,这是不正确的
NLP-自然语言处理
*