实战智能推荐系统(1)-- 个性化推荐系统及其基本推荐算法

时间:2022-12-07 14:59:44

个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。

推荐系统有3个重要的模块:用户建模模块,推荐对象模块,推荐算法模块

主要推荐算法

1. 基于内容推荐
基于内容推荐是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推断的,而不需要依据用户对项目的评价意见,更多的需要用机器学习的方法从关于内容的特征描述的事件中得到用户的兴趣资料。用户的资料模型取决于所用学习方法,常用的有决策树,神经网络和基于向量的表示方法等。基于内容的用户资料是需要有用户的历史数据,用户资料模型可能随着用户偏好的改变而改变。

基于内容推荐方法的优点:
(1)不需要其他用户的数据,没有冷开始问题和稀疏问题

(2)能为具有特殊兴趣爱好的用户进行推荐
(3)能推荐新的或者不是很流行的项目,没有新项目问题
(4)通过列出推荐项目的内容特征,可以解释为什么推荐那些项目
(5)已经有比较好的技术,如关于分类学习方面的技术已相当成熟

缺点是要求内容能容易抽取成有意义的特征,要求特征内容有良好的机构性,并且用户的口味必须能用内容特征形式来表达,不能显式的得到其他用户的判断情况。

2. 协同过滤推荐
协同过滤推荐技术是推荐系统中应用最早和最为成功的技术之一,它一般采用最邻近技术,利用用户的历史爱好信息计算用户之间的距离。然后利用目标用户的最邻近用户对商品的评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐
协同过滤最大的优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐,电影。基于协同过滤的推荐系统可以说是从用户的角度来进行相应推荐的,而且是自动的,不需要用户努力的找到适合自己兴趣的推荐信息,如调查问卷等。
和基于内容的过滤方法对比,协同过滤具有如下的优点:
(1)能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等
(2)共享他人的经验,避免了内容分析的不完全和不精确
(3)有推荐新信息的能力,可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的,这也是协同过滤基于内容过滤一个较大的差别,可以发现用户潜在的但自己尚未发现的兴趣爱好。

(4)能够有效的使用其他相似用户的反馈信息,减少用户的反馈量,加快个性化学习的速度。

3. 基于关联规则推荐
基于关联规则的推荐是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业中已经得到了成功的应用。管理规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y,其直观的意义就是用户在购买某些商品时有多大的倾向去购买另外一些商品

算法的第一步关联规则的发现最为关键且耗时,是算法的瓶颈,但可以离线进行。

4. 基于效用推荐

基于效用推荐是建立在对用户使用项目的效用情况上计算的,其核心问题是怎么样为每一个用户去建立一个效用函数。因此,用户资料模型很大程度上是由系统所采用的效用函数决定的。基于效用推荐的好处是它能把非产品的属性考虑进去,如供应商的可靠性和产品的可得性等考虑到效用计算中。

5. 基于知识推荐

基于知识推荐在某种程度上可以看成一种推理技术,它不是建立在用户需要和偏好的基础上推荐的。基于知识的方法因它们所用的功能知识不同而有明显的区别。效用知识是一种关于一个项目如何满足某一特定用户的知识,因此能解释需要和推荐的关系。所以用户资料可以是任何支持推理的知识结构,它可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表示。

6. 组合推荐
由于各种推荐方法都有优缺点,所以在实际中,组合推荐经常被采用。
研究应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用于基于内容的方法和协同过滤的推荐方法去产生一个预测结果,然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐的一个重要原则就是通过组合后要能避免或弥补各自推荐技术的弱点。
在组合上,有研究人员提出了七种组合思路
1)加权:加权多种推荐技术的结果
2)变换:根据问题背景和实际情况或要求决定变换采用不同的推荐技术
3)混合:同时采用多种推荐技术给出多种推荐结果为用户提供参考
4)特征组合:组合来自不同推荐数据源的特征被另一种推荐算法所采用
5)层叠:先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在这个结果上产生更精确的推荐结果
6)特征扩充:一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中,感觉有点像特征组合
7)元级别:用一种推荐方法产生的模型作为另一种推荐方法的输入