mahout的安装、配置及运行java程序

时间:2021-10-18 15:21:13

一、下载安装包:

http://mahout.apache.org/general/downloads.html

二、解压:

将下载的安装包解压到需要的目录下

三、配置环境变量:

export MAHOUT_HOME=/Users/iris/Downloads/apache-mahout-distribution-0.10.
export MAHOUT_CONF_DIR=$MAHOUT_HOME/conf
export PATH=$MAHOUT_HOME/conf:$MAHOUT_HOME/bin:$PATH

若不使用hadoop,只在本机运行则设置mahout_local变量:

export MAHOUT_LOCAL=true

四、验证安装mahout是否成功:

执行命令mahout,若安装成功,则出现如图所示的一些算法:

mahout的安装、配置及运行java程序

五、接下来,需要结合maven和eclipes构建mahout的开发环境。具体步骤参见博客 http://blog.fens.me/hadoop-mahout-maven-eclipse/

其中由于这篇博客里面的pom.xml是针对mahout 0.6版本写的,而现在用的0.10.1版本变化较大,所以pom.xml也要作相应变化。否则就会在运行mvn clean install的最后失败:Could not find artifact org.apache.mahout:mahout-core:jar:0.10.1 in central (https://repo.maven.apache.org/maven2)。

新pom文件的修改方法依据官网http://mahout.apache.org/general/downloads.html,只要在原来新建项目下的pom文件中添加官网中的两个dependency就可以了。具体可以看这个http://f.dataguru.cn/thread-516316-1-1.html

如果程序中需要用到org.apache.mahout.cf.taste的包的话,还需要添加:

<dependency>
<groupId>org.apache.mahout</groupId>
<artifactId>mahout-mr</artifactId>
<version>0.10.1</version>
</dependency>