3.1冷启动问题简介:
冷启动问题(cold start)主要分三类:
• 用户冷启动
• 物品冷启动
• 系统冷启动
参考解决方案:
• 推热门
• 利用用户的信息。(如:性别、年龄、地域等)
• 利用登录帐号的社交网络信息
• 要求新用户登录时做一些反馈
3.2利用用户注册信息
下面介绍一种最简单的,基于用户信息的推荐算法。其核心问题就是计算每种特征的用户喜欢的物品。 也就是说,对于每种特征f, 计算具有这种特征的用户对各个物品的喜欢程度p(f,i)
p(f,i)可以简单定义为物品i在具有f的特征的用户中的热门程度:
N(i)是喜欢物品i的用户集合,U(f)表示具有特征f的用户集合。
可以看出具有比较高的N(i)就很可能有比较高的p(f,i), 所以推出的结果很可能就是热门结果。因此我们可以将p(f,i)定义为喜欢物品i的用户中具有特征f的比例:
在数据集做实验Last.fm
代码待写:
3.4 利用物品的内容信息:
对于user-cf 来说,物品冷启动问题并不非常敏感。因为很多网站,给用户的内容不止有基于推荐的。
对于item-cf, 物品冷启动必须频繁更新物品相似度表,时间复杂度高。
基于物品内容的模型,没有冷启动问题,可适当解决冷启动。一般来说,物品内容可以通过向量空间模型(vector space model)表示。该模型会将物品表示成一个关键词向量。对于文本,可能会用到自然预言处理里面的分词技术。
向量空间模型在长文本可能会取得比较好的效果。(短文本不行,可以考虑word2vec,有待学习)
话题模型(Topic model)
代表性的LDA. LDA有三种元素,文档,话题,词语。每篇文档都会表现为词的集合,称为bag of words. 每个词在一篇文章中属于一个话题。
有待学习。。。。
相关文章
- 旅游推荐系统设计与实现代码+数据库+LW)-结 论
- 【Java毕设选题推荐】基于SpringBoot的springboot基于BS构架的失物招领系统设计与实现
- 11.推荐系统的安全与隐私保护
- python 房价预测与房屋推荐系统
- 基于微信小程序的校园二手交易平台设计与实现,微信小程序(定制+讲解+咨询)校园二手商品在线交易系统、校园二手市场管理与推荐工具、智能化商品交易与推荐平台
- 信号与系统(郑君里)——第三章(傅里叶变换)
- 【大数据技术与推荐系统(7)】Mahout推荐算法实战
- 第三章_进程与线程-系统内核
- Java项目:37 springboot003图书个性化推荐系统的设计与实现
- Java项目:36 springboot图书个性化推荐系统的设计与实现003