如何构建互联网产品的用户画像

2024-04-20 07:26

1. 如何构建互联网产品的用户画像

这是个比较大的话题,恐怕难以能简单一两句话说清
首先,用户画像是对某个产品某个时期用户群体的抽象,可以是一个群体,也可以是多个群体。也就是说一个产品在某个阶段用户画像可能有多个。
收集数据。选取有共同特征的一类人,抽象他们的网络数据、行为数据、用户内容偏好数据、用户交易数据,比如年龄,职业,收入,使用产品习惯。
建立数据模型。抽象出来的是一类人的共同特性。
把模型具象化。看做一个人他表现出来那些特征,隐藏那些行为趋势。

用户画像的目的是帮我们产品明确目标进行定位设计和运营。

如何构建互联网产品的用户画像

2. 如何构建用户画像

我们用教育行业来说一下这个问题,
2017年4月初,62个在教育行业产品获投资,这一消息,使得教育行业产品再次被热议。事实上,教育行业早已是一片红海,有调查显示,近6成的互联网学习者位于三四线城市,而一款好的教育产品,会让用户对学习这件事情上瘾,不断对后续的课程进行消费。总的来说教育行业仍旧有突出重围的希望。

在教育产品竞争如此激烈的今天,如何争夺到更多的用户,似乎是困扰着众多教育产品的问题。本文以在线教育产品为例,说说如何构建用户画像,并为下一步获客制定运营计划。

什么是用户画像

用户画像是指,建立在一系列真实数据之上的目标用户模型。根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,形成了一个人物原型。

为什么要构建用户画像

构建用户画像,就是帮产品找到用户真实的述求点,能够帮产品的功能设计提供依据。对运营人员来说,最基本的一点就是了解用户。通过对用户信息的采集,分析,抽离,生成最终的用户画像。构建用户画像后,就可以制订更精准的运营方案了。

在线教育产品,如何构建用户画像

1.用户画像分析逻辑

在构建用户画像之前,先来看看用户画像构建、分析的一个逻辑。



2.信息采集与分析

在线教育产品构建用户画像的第一步 ,收集用户的基本信息。此处重点收集三个维度的用户信息,个人信息,社会关系,消费水平。




个人信息:在这一维度,可以采集包括年龄,性别,教育程度,职业等基本属性。在线教育产品可以重点采集教育程度,职业等信息。

个人信息是一个人的基本属性,一般不会轻易改变。个人信息这一维度的数据,有很大的参考意义。

社会关系:是否已婚,是否有小孩,有其他兄弟姐妹吗,父母亲分别是谁呢。用户的社会关系以及社会关系的个人信息,可以推断出这个人的性格。

用户的社会关系关乎一个人的隐私,一般比较难获取。

消费水平:月收入是多少,月消费能力怎样,是否需要还房贷,是否有信用卡。

消费水平可以直观的看出用户的生活状况,但是难以区分真假,因为用户有可能在说谎。




采集完用户的基本信息之后,下一步应当采集用户的行为特征。

行为特征可以理解为用户无意识的惯性行为。根据用户的行为特征,可以推断出其心理特征。

比如,用户会使用高端团购APP,可以推断出改用户对生活品质的要求较高。

3.为用户打上标签,细分人群

不同的用户群有不同的目标、行为和观点,细分用户群可将问题变的清晰,同时也作为用户画像优先级划分的依据。

根据采集的用户信息,将用户打上专属标签,后续可根据标签,对用户进行细分。

4.丰富用户信息

丰富用户画像是构建用户画像过程中最需要打磨的一个部分,将采集到的大量枯燥且凌乱的数据,分析且赋予更多的元素,让它们成为鲜活的个体,非常考验团队的敏锐度和细腻度。


根据用户画像,如何在精细化运营上发力

对运营来说,构建完用户画像,但是没有将用户画像应用到运营推广中,就等于做了个无用功。在线教育产品在构建完用户画像之后,应该重点考虑如何利用用户画像,辅助课程开发和产品运营,做到精细化运营。

做精细化运营的一个基本思路就是理清楚一个逻辑:在什么时间把什么内容发给什么类型的用户。

1.根据搜索数据的个性化运营

用户浏览了某一个课程,可以根据用户标签,推荐相同类型的课程。
更多内容,可百度一下“在线教育app:构建用户画像并制定运营计划怎么做”。

3. 如何构建用户画像

一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。
3.1 数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为静态信息数据、动态信息数据两大类。

静态信息数据
用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。
动态信息数据
用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。
本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。
在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。
3.2 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
3.3 数据建模方法
下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。
什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。
什么地点:用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。
内容:每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。
标签 权重
矿泉水 1 // 超市
矿泉水 3 // 火车
矿泉水 5 // 景区
类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。
所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。
什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。
不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1
红酒 1 // 浏览红酒
红酒 5 // 购买红酒
综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签:红酒,长城
时间:因为是昨天的行为,假设衰减因子为:r=0.95
行为类型:浏览行为记为权重1
地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665。
上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。

如何构建用户画像

4. 如何构建用户画像

二、为什么需要用户画像
用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?
也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况?
大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。
三、如何构建用户画像
一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。
3.1 数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为静态信息数据、动态信息数据两大类。

静态信息数据
用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。
动态信息数据
用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。
本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。
在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。
3.2 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
3.3 数据建模方法
下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

5. 如何构建用户画像

  一 用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?
  二 也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况?
  三大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。

如何构建用户画像

6. 如何构建用户画像

一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。
3.1 数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为静态信息数据、动态信息数据两大类。

静态信息数据
用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。
动态信息数据
用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。
本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。
在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。
3.2 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
3.3 数据建模方法
下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。
什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。
什么地点:用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。
内容:每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。
标签 权重
矿泉水 1 // 超市
矿泉水 3 // 火车
矿泉水 5 // 景区
类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。
所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。
什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。
不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1
红酒 1 // 浏览红酒
红酒 5 // 购买红酒
综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签:红酒,长城
时间:因为是昨天的行为,假设衰减因子为:r=0.95
行为类型:浏览行为记为权重1
地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665。
上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。

7. 如何简单的设计用户画像

亲您好,很高兴为你解答(* ̄︶ ̄)如何简单的设计用户画像:1、如何设计标签要做好一个标签库,需要做好几点准备:第一:你要对业务数据非常熟悉,如果你对自己的数据有什么维度,什么指标都不清楚,那别做了,也做不好一个画像出来。第二:对数据表,核心业务也熟悉后,还需要对业务部门相关人员做一次调研,收集他们有哪些比较关心的标签或行为。这一点很重要,技术人员对业务的理解跟业务人员对业务的理解不一样的,最终标签还是要赋能业务,实际使用者还是业务部门的人。做一次调研非常必要,而且要做好问卷调查表设计,具体要根据业务去设定就不展开了。第三:尽量设计最细颗粒的指标或维度,不要有歧义或模糊的标签定义,比如能用是否的就不要是什么?尽量能枚举这个标签的值出来。形成一个类似的下面的Excle标签定义表:2、标签开发如果你数据是在数据库存放,开发起来就比较简单了,基本用SQL就可以完成,如果放在HDFS,也问题不大,在Hive里也是可以用HQL完成,所以标签的开发,80%的工作量在SQL上。难度不大,主要还是在业务的理解上。只有把业务数据理解透了,才能打出有价值的标签出来。显性标签也就是原始的标签可以直接读取业务表某个字段就好了,比如会员的地理位置属性,年龄,生日等。但是有些标签需要深加工,比如用户分群、是否价格敏感型等,这些标签需要2次加工,属于隐性标签,根据一定的业务规则或算法计算而出,不过也是可以通过复杂一点的SQL来实现,无非就是多嵌套几层、多用几个函数而已。数据加工好后的标签数据存放一张宽表,这表以用户id唯一值,一个用户一条记录,就得到了关于用户的一张标签库表,为后面标签的调取和应用提供基础数据。3、画像标签应用标签开发完了,要用起来才有价值,存在数据库里是没有意义的,如何用起来?主要讲2点:数据洞察,打完标签后的用户数据更容易我们去了解我们用户的特性,也只有我们了解用户后才能更好的为用户提供有价值的服务。所以标签是有助于我们洞察和透析用户的。【摘要】
如何简单的设计用户画像【提问】
亲您好,很高兴为你解答(* ̄︶ ̄)如何简单的设计用户画像:1、如何设计标签要做好一个标签库,需要做好几点准备:第一:你要对业务数据非常熟悉,如果你对自己的数据有什么维度,什么指标都不清楚,那别做了,也做不好一个画像出来。第二:对数据表,核心业务也熟悉后,还需要对业务部门相关人员做一次调研,收集他们有哪些比较关心的标签或行为。这一点很重要,技术人员对业务的理解跟业务人员对业务的理解不一样的,最终标签还是要赋能业务,实际使用者还是业务部门的人。做一次调研非常必要,而且要做好问卷调查表设计,具体要根据业务去设定就不展开了。第三:尽量设计最细颗粒的指标或维度,不要有歧义或模糊的标签定义,比如能用是否的就不要是什么?尽量能枚举这个标签的值出来。形成一个类似的下面的Excle标签定义表:2、标签开发如果你数据是在数据库存放,开发起来就比较简单了,基本用SQL就可以完成,如果放在HDFS,也问题不大,在Hive里也是可以用HQL完成,所以标签的开发,80%的工作量在SQL上。难度不大,主要还是在业务的理解上。只有把业务数据理解透了,才能打出有价值的标签出来。显性标签也就是原始的标签可以直接读取业务表某个字段就好了,比如会员的地理位置属性,年龄,生日等。但是有些标签需要深加工,比如用户分群、是否价格敏感型等,这些标签需要2次加工,属于隐性标签,根据一定的业务规则或算法计算而出,不过也是可以通过复杂一点的SQL来实现,无非就是多嵌套几层、多用几个函数而已。数据加工好后的标签数据存放一张宽表,这表以用户id唯一值,一个用户一条记录,就得到了关于用户的一张标签库表,为后面标签的调取和应用提供基础数据。3、画像标签应用标签开发完了,要用起来才有价值,存在数据库里是没有意义的,如何用起来?主要讲2点:数据洞察,打完标签后的用户数据更容易我们去了解我们用户的特性,也只有我们了解用户后才能更好的为用户提供有价值的服务。所以标签是有助于我们洞察和透析用户的。【回答】

如何简单的设计用户画像

8. 手把手教你构建用户画像系统

如今,在大数据高速发展的背景下,用户画像在各个领域都得到了广泛的应用。
  
 构建一个详实的用户画像, 有利于运营人员快速了解用户基本情况,为工作的开展提供指导和帮助。 那么,用户画像包含哪些方面的内容?下面,和播妞一起来具体看看吧!
  
 谈起用户属性我们都不陌生,它刻画出了用户的基本信息。一般来说,用户属性又包含了以下常见的指标: 用户的年龄、性别、设备型号、安装/注册状态、职业等等用户静态特征。 
  
 这里需要注意用户性别这一属性,既可以指自然性别,又可以指购物性别。购物性别是指用户购买物品时的性别取向,可能一个实际性别的女的用户,但是经常购买男性性别明显的商品,那么她的购物性别就是男性。
                                          
 所谓的用户行为,即通过用户行为可以挖掘其偏好和特征。常见的用户行为分析包括了: 用户订单相关行为、下单/访问行为、用户近30天行为类型指标、用户高频活跃时间段、用户购买品类、点击偏好、营销敏感度等相关行为。 
  
 具体来讲,用户消费包含了 用户浏览、加购、下单、收藏、搜索商品等等内容。 细分用户喜好的商品品类,这样一来给用户推荐或营销商品的准确性才能越高。
  
 所谓风险控制是指对用户 从征信风险、使用设备的风险、在平台消费过程中产生的问题等方面考量其风险程度。 
  
 互联网企业的用户可能会遇到薅羊毛、恶意刷单、借贷欺诈等行为的用户,为了防止这类用户给平台带来损失和风险,互联网公司需要在风险控制方面构建起相关的指标体系,有效监控平台的不良用户。
  
 社交属性用于了解 用户的家庭成员、社交关系、社交偏好、社交活跃程度等方面, 通过这些信息可以更好地为用户提供个性化服务。
  
 在日常使用社交软件时,我们可以发现社交软件中的信息流广告会结合我们的社交特征进行个性化推送。
                                          
 用户画像可以把用户信息尽可能的标签具象化,从而使营销从业者对用户提供更加有针对性的服务。因此, 用户画像的构建至关重要,其中包含的用户属性、用户行为、用户消费、风险控制和社交属性等等方面内容, 更是一个都不能少。