【文件属性】:
文件名称:自然语言处理实验 字串处理
文件大小:50.94MB
文件格式:RAR
更新时间:2021-06-07 13:14:04
自然语言处理 汉字的熵 字串
实验 字串处理
1)汉字字频统计
1. 给出前100个汉字高频字的频率统计结果;
2. 分别给出前1、20、100、600、2000、3000汉字的字频总和;
3. 计算汉字的熵值;
2)英文词频统计
1. 给出前100个高频单词的频率统计结果;
2. 分别给出前1、20、100、600、2000、3000单词的词频总和;
3. 计算单词的熵值;
3)针对不同规模语料重复上述实验;