产品设计中的推荐引擎介绍

什么是推荐引擎?

推荐引擎利用特殊的信息过滤(IF,Information-Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的,或是基于用户所在的社会或社团环境。

推荐引擎的分类

1. 个性化的推荐--根据用户过去在网站的行为进行推荐。

2. 社会化推荐--根据类似用户过去在网站的行为进行推荐。

3. 基于产品的推荐--基于产品本身的特性进行推荐。

4. 以及上述三种的方法的组合。

推荐引擎的开放api

商业推荐引擎不仅仅用来把数据计算出来,在后期必须充分的利用这些高质量的推荐数据,通过推荐引擎的开放API,可以在任何需要调用推荐数据的地方使用这些高质量的推荐数据,实现集中计算,分散使用。企业推荐引擎的数据可以扩展到网站的任何一个角落,给互联网客户贴心的用户体验。

推荐引擎的通用算法

1.基于关联规则的推荐算法(Association Rule-based Recommendation)

2.基于内容的推荐算法 (Content-based Recommendation)

内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。

基于内容过滤的系统其优点是简单、有效。其缺点是特征提取的能力有限,过分细化,纯基于内容的推荐系统不能为客户发现新的感兴趣的资源,只能发现和客户已有兴趣相似的资源。这种方法通常被限制在容易分析内容的商品的推荐,而对于一些较难提取出内容的商品,如音乐CD、电影等就不能产生满意的推荐效果。

3.协调过滤推荐算法 (Collaborative Filtering Recommendation)

与传统文本过滤相比,协同过滤有下列优点:

1)能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐。

2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤。

3)推荐的新颖性。 正因为如此,协同过滤在商业应用上也取得了不错的成绩。Amazon,CDNow,MovieFinder,都采用了协同过滤的技术来提高服务质量。

缺点是:

1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题)。

2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题)。

3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。因此,现在的电子商务推荐系统都采用了几种技术相结合的推荐技术。

推荐引擎的过滤方式

1.基于内容的过滤

了解内容和用户的特质,送上合适产品的做法,被称为“基于内容的过滤” (Content Based Filtering)

2.协同过滤”(Collaborative Filtering) 的推荐方式

 


图–协同过滤二层推荐模型

 

以“协同过滤”推荐机制为核心,网站并不需要做出如同“What to Rent”的“性格-产品”匹配,而只需要了解“用户都在同哪些人进行交往”、“用户加入了哪些组群”、“用户都在看谁的页面”这样的问题,然后根据“物以类聚、人以群分”的思路为用户推荐他的伙伴都感兴趣的事物。

第一代的协同过滤技术,又被称为基于用户(User-based)的协同过滤。基于用户的协同过滤,基本原理是基于用户行为选择的相关性。

协同过滤的核心问题是寻找与目标用户兴趣相近的一组用户。这种相似用户通常被称为最近邻居(Nearest Neighbor)。用户之间的相似度是通过比较两个用户的行为选择矢量得到的。于是第二代基于内容项(Item-based)的协同过滤技术就产生了。与基于用户的技术不同的是,这种方法比较的是内容项与内容项之间的相似度。 Item-based方法同样需要进行三个步骤获得推荐:

1)得到内容项(Item)的历史评分数据。

2)针对内容项进行内容项之间的相似度计算,找到目标内容项的“最近邻居”。

3)产生推荐。这里内容项之间的相似度是通过比较两个内容项上的用户行为选择矢量得到的。基于用户的推荐系统相比,基于内容项的推荐系统最大的改进是更具有扩展性。基于内容项的方法通过计算内容项之间的相似性来代替用户之间的相似性。

不论是第一代的基于用户方法,还是第二代的基于内容项方法,都不可避免的遇到数据稀疏的问题。

基于内容和基于协同过滤两种方式的区别

无论从用户还是服务提供者的角度出发,这两种推荐方式都有各自明显的优劣。如果采用“基于内容的过滤”,那么在完成内容和用户互相匹配的过程中,就可能出现“越读越窄”、“越听越窄”、“越看越窄”的问题,提供的内容完全与用户兴趣点相吻合,而没有发散。

“协同过滤”在很大程度上避免了这个问题,但是他需要用户达到一定数量级之后才能发挥出网站创建者预想的效果,这种“网络效应”使得同一市场上的后来者很难找到切入的机会。而用户一旦不能得到“好处”,可能迅速离去,而来不及提“利他”的后话。

3.基于实时行为的推荐

目前流行的实时搜索开始了这方面的研究。

 

文章由PM28网编辑,作者:海阁,如若转载,请注明出处:http://www.pm28.com/505.html欢迎投稿

联系我们

在线咨询:点击这里给我发消息

邮件:403567334@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息