Mahout介绍-炼数

时间:2023-03-10 03:09:12
Mahout介绍-炼数

Mahout的中文含义:象夫

Mahout介绍-炼数

Mahout起源

2008年成为Lucene的子顷目,Lucene作为搜索引擎顷目,

存在很多文本数据分析和挖掘的需求(例如文本重复判断,文本自动分类等等),

导致Lucene顷目中部分开发者转向机器学习领域研究算法,最终这些机器学习算法形成最初的Mahout
吸收开源协同过滤算法顷目Taste
2010年成为Apache*顷目

常见算法的Map-Reduce化

Mahout介绍-炼数

Mahout的特点

Mahout的主要目的是实现可伸缩的机器学习算法(就是算法的M-R化)

但也不一定要求基亍Hadoop平台,核心库中某些非分布式的算法也具有很好的性能
目标是帮助开发人员快速建立具有机器智能的应用程序,目前比较成熟和活跃的主要包括
1 频繁模式挖掘
2 聚类算法
3 分类器
4 推荐系统
5 频繁子顷挖掘

Mahout目前支持和研究中的算法列表

https://cwiki.apache.org/confluence/display/MAHOUT/Algorithms

Mahout介绍-炼数