Win8.1 安装nltk及nltk_data数据

时间:2022-01-20 16:14:10

最近基本完成了python核心编程v2.0的学习,因为项目的原因,开始看python自然语言处理
这本书的工具是用的nltk,在这里记录一下在自己机子上的安装过程。
系统: win8.1
python版本:2.7.13 ,python的安装不多说了。书上给出的官网http://www.nltk.org/ ,基于3.5版本的,但是在我完成安装后(不是在官网下的),nltk 3.2.4也是可以在2.7版本运行的

安装过程请参照
http://blog.csdn.net/joey_su/article/details/17287559
过程中未遇到文中提到的 python version 2.7 required的问题,exe文件找到了python2.7的安装位置。
不过感觉直接pip 安装 (文中步骤4)即可
最后的结果就是在cmd 中间 import nltk 不报错即可,如果是pip 安装的,pip list里面可以看得到nltk就可以

书中用到的数据需要下载,即nltk_data。
第一种办法是:

import nltk
nltk.download()

会弹出一个tk写的nltk的下载界面,book项即为要下载的数据,但是试过之后发现无法忍受那个下载速度

解决下载nltk_data问题的办法参考以下博客。测试的办法也在文中提到了。
http://www.jianshu.com/p/9c48e8edc7aa
按流程走完后即可以使用了,我的数据是解压到了C盘根目录下。