基于内容推荐(CB)的推荐算法.doc
《基于内容推荐(CB)的推荐算法.doc》由会员分享,可在线阅读,更多相关《基于内容推荐(CB)的推荐算法.doc(4页珍藏版)》请在三一文库上搜索。
1、基于内容推荐(CB)的推荐算法基于内容推荐概要基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。主要是从两个方法来描述基于内容的推荐方法:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较
2、高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹角的cosine值。基于内容推荐的步骤1、对数据内容分析,得到物品的结构化描述2、分析用户过去的评分或评论过的物品的,作为用户的训练样本3、生成用户画像a.可以是统计的结果(后面使用相似度计算)b.也可以是一个预测模型(后面使用分类预测计算)4、新的物品到来,分析新物品的物品画像5、利用用户画像构
3、建的预测模型,预测是否应该推荐给用户Ua.策略1:相似度计算b.策略2:分类器做预测6、进一步,预测模型可以计算出用户对新物品的兴趣度,进而排序7、进一步,用户模型在变化,通过反馈更新用户画像(用户画像在这里就是预测模型)反馈-学习,构成了用户画像的动态变化基于内容推荐的层次结构* 内容分析器文档的数据处理得到结构化的数据,存储在物品库中* 信息学习器收集有关用户偏好的数据特征,泛华这些数据,构建用户特征信息(机器学习)通过历史数据构建用户兴趣模型(通过分类的方法,提取特征,特征就是组建用户画像的基础)生成兴趣特征(正样本)和无兴趣特征(负样本)* 过滤组件将用户的个人信息和物品匹配生成二元或
4、连续性的相关判断(原型向量和物品向量的余弦相似度)基于内容推荐(CB)的推荐算法就目前看,Collaborative Filtering Recommendations (协同过滤,简称CF) 还是目前最流行的推荐方法,在研究界和工业界得到大量使用。但是,工业界真正使用的系统一般都不会只有CF推荐算法,Content-based Recommendations (基于内容推荐,CB) 基本也会是其中的一部分。CB根据用户过去喜欢的产品(items),为用户推荐和他过去喜欢的产品相似的产品。例如,一个推荐饭店的系统可以依据某个用户之前喜欢很多的烤肉店而为他推荐烤肉店。 CB最早主要是应用在信息检
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 内容 推荐 CB 算法
链接地址:https://www.31doc.com/p-3416908.html