下载一个 hadoop-eclipse-plugin-*.jar的eclipse插件,并放在plugins目录下
重启eclipse

打开视象,找“大象”

连接HDFS


success

编程准备:
1.建个java项目

在项目下建个文件夹,如lib,导入所需的jar包。然后选中所有的jar包builtpath



mapreduce-client和hdfs是关键的,还有yarn-client
IKAnalyzer用于分词
MR流程:1.切分(不写代码);2.mapper(开始写代码)3.
mapper须继承父类Mapper

重写map方法
