简介

在大数据领域,用户画像一般指用户信息标签化。首先,通过多种渠道方式,尽可能多地收集用户各种各样维度的数据,如用户信息、消费水平、消费习惯、购买产品类目偏好等;其次,综合收集到的数据,对用户特征进行刻画与抽象;最后再对这些特征进行分析、统计和推断,挖掘潜在价值。

一个完善的用户画像系统,不仅可以帮助企业进行精细化运营管理,如提升用户购买转化率、商品的曝光/点击率等运营指标,甚至为企业的战略决策提供支持。现在,互联网上常见的针对用户进行个性化推荐、精准营销(如定向广告投放)、个性化服务等,有不少是直接依赖用户画像。例如,不同用户打开同一个外卖 APP,用户极有可能在 APP 首页上看到的是不同的推荐商家,即所谓的“千人千面”,其背后就是用户画像的一个应用场景——根据用户当前所在位置、历史订单数据(口味、消费水平等),给用户打上“标签”,并根据标签给用户推荐合适的商家。

根据打标签的方式,可以将标签分为以下三大类:

  • 统计类标签,通过对用户信息、访问记录、下单消费等常规数据直接进行统计得到,如用户性别、常驻地、年龄、设备类型、近 30 日活跃天数、近 30 日下单天数、近 30 日订单量等。统计类标签是最常见的用户标签,是用户画像的构成基础。
  • 规则类标签,通过对用户的常规数据加上一定的规则进行统计得到,如用户的流失程度标签(轻度流失用户、中度流失用户、重度流失用户),对轻度流失用户这一口径的定义为“用户最后访问 APP 的日期距离当前日期的天数在[30, 60) 之间”。规则类标签也是常见的用户标签,其中的规则定义一般由业务运营人员(熟悉业务)和数据分析人员(熟悉数据的分布特征)协商确定。
  • 机器学习挖掘类标签,通过机器学习算法挖掘产生,如根据用户浏览的商品信息、购买的历史记录等数据,计算用户对购买某商品的概率。因为此类标签的开发周期长、开发成本高,相对而言比较少见。

给用户打“标签”例子

下图的用户画像,是某电商平台通过该用户实名时填写的基本信息、购买的产品类型、以及其他搜索行为等维度数据,给用户打的标签:宝妈,孩子年龄 1-3 岁,家有宠物猫,IT 从业者,爱阅读,热心公益与时政等。

用户画像

“打标签”的逻辑如下:

从用户实名时填写的基本信息和埋点数据,可以统计出该用户的年龄段(18-24岁)、性别(女)、常驻地广州;

从用户购买的商品名称、商品类目、购买频次、数量等信息,可以推断出该用户大概率是 IT 从业者和喜欢阅读,因为经常购买 Hive、Flink、Python、Kudu 等技术类与非技术类书籍;家里应该有养宠物猫,因为该用户购买比瑞吉猫粮、皮旦猫窝等宠物类目商品的频次较高;爱看电影,每月都有购买电影票商品的记录;用户有可能是一名宝妈,孩子年龄应该在 1-3 岁,因为经常定期购买美赞臣奶粉、尤妮佳纸尿裤和拉拉裤,按奶粉段数可推断孩子年龄段;从用户购买商品信息与购买频次,还可以推断出用户的购物喜好品牌是比瑞吉、美赞臣、蕉下、皮旦、尤妮佳等。

从用户浏览的文章类型和其他渠道来源信息,可以推断出用户热心公益与时政,因为用户设置了每月定期公益捐款、经常浏览时政类新闻等。

小结

在大数据领域,用户画像是指用户信息标签化。根据打标签的方式,可以将标签分为统计类标签、规则类标签和机器学习挖掘类标签。用户画像一般应用在企业精细化运营管理,针对用户进行个性化推荐、精准营销(如定向广告投放)、个性化服务等。

(END)