首页 解决方案
个性化系统推荐方案
► 需求分析

个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。

 

► 解决方案

a)     推荐引擎架构
推荐引擎架构图:

推荐引擎的构建来源于不同的数据源(也就是用户的特征有很多种类,例如统计的、行为的、主题的)+不同的推荐模型算法,推荐引擎的架构可以是多样化的(实时推荐的+离线推荐的),然后融合推荐结果(人工规则+模型结果),融合方式多样的,有线性加权的或者切换式的等。
 
法本DMP技术架构:

 
b)        用户建模
用户建模的必要性:
  • 一个好的推荐系统要给用户提供个性化的、高效的、准确的推荐,那么推荐系统应能够获取反映用户多方面的、动态变化的兴趣偏好
  • 用户建模是获取和维护与用户兴趣、需求或习惯相关的知识的过程,其结果将产生一个表示用户特有背景知识或兴趣、需求的用户模型。
用户建模过程:

通过用户画像抽取用户全貌:
  • 用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌。
  • 用户画像是企业应用大数据技术的基石,为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。
c)      内容建模
  • 不同的对象,特征也不相同,目前并没有一个统一的标准来进行统一描述,主要有基于内容的方法和基于分类的方法两大类方法。针对文档类对象的这两个表示方法给以分析。
    • 基于内容的方法是从对象本身抽取信息来表示对象,使用最广泛的方法是用加权关键词矢量,该方法通过对一组文档的统计分析得出文档的特征向量。在完成文档特征的选取后,还得计算每个特征的权值,权值大的对推荐结果的影响就大。目前使用最广泛的是TF—IDF方法。
    • 基于分类的方法是把推荐对象放入不同类别中,这样可以把同类文档推荐给对该类文档感兴趣的用户了。文本分类的方法有多种,比如朴素贝叶斯(Naive-Bayes),k最近邻方法(KNN)和支持向量机(SVM)等。对象的类别可以预先定义,也可以利用聚类技术自动产生。
  • 文本等对象特征提取技术相对比较成熟,但推荐系统的对象不一定具有文本特征或文本不足以作为描述,尤其是网络上广泛存在的多媒体数据,自动化的特征提取方法需要结合多媒体内容分析领域的相关技术。
  • 推荐系统推荐给用户的对象首先不能与用户看过的对象重复,其次也不能与用户刚刚看过的对象不是太形似或者太不相关,这就是所谓的模型过拟合问题(可扩展性问题)。
  • 推荐系统中出现新的对象时,推荐系统尤其是协同过滤系统中,新对象出现后必须等待一段时间才会有用户查看并进行评价,在此之前推荐系统无法对此对象进行分析和推荐,这就是推荐系统研究的另一个难点和重点——冷启动问题。
模型生命周期管理:

d)     推荐算法
序号 算法名称 原理介绍
1 人口统计学 根据系统用户的基本信息发现用户的相关程度,采用K-Means聚类算法将相似用户喜爱的其他产品推荐给当前用户
2 基于内容推荐 根据推荐产品或内容的元数据,发现产品或者内容的相关性,然后基于用户以往历史的喜好记录,推荐给用户相似的产品
3 协同过滤 根据所有用户对产品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群,在一般的应用中是采用“K近邻” (k-Nearest Neighbor)分类算法;然后,基于这 K 个邻居的历史偏好信息,为当前用户进行推荐。MLLib 使用交替最小二乘法(ALS) 来学习其中的隐性因子。
4 逻辑回归 通过客户特征权重对客户特征向量在不同维度上的取值进行加权,并用合适的逻辑函数将其压缩到0-1的范围,Spark中采用梯度下降法做为收敛方法,最终作出客户购买哪种证券产品的概率计算
 
 
► 方案价值
  • 分析处理海量数据,快速处理新增数据和实时交互;
  • 灵活加入和迭代各种推荐算法;
  • 低延迟响应高QPS的推荐请求;
  • 兼容多行业多领域应用。
您来访的目的是了解: IT服务 解决方案 应聘

0755-26921495