数据分析的影响因素(一)——底层数据

2015-07-27 鹈鹕全面客户体验管理

作者:侯天华@鹈鹕顾问

随着近几年数据技术的飞速发展,越来越多的企业开始意识到数据对于企业管理的重要性,而同时他们也看到自身企业数据管理的不足,这些不足体现在底层数据维护上、分析算法应用上以及组织架构模式上。而随着近几年数据分析的逐步发展,相信很短的时间里就会有越来越多的企业能够成功地发挥隐藏在数据中的价值。在本文中我将会从底层数据方面的变化,即指标内容的拓展角度来说明近几年企业影响数据分析的各种技术及管理模式的变化。在此后我还会分别从分析算法应用和组织结构发展的角度来介绍影响数据分析的各种因素及其近年的变化情况。

很多网上的文章经常说,我们现在的数据量已经非常大了,能够达到TB(1024GB),达到PB(1024TB),甚至达到更大的ZB(1024*1024PB)等计量单位级别,所以我们已经处在大数据的时代当中了。但这句话并不完整,其中缺失的两个重要概念在于指标的数量和可关联指标数量。

① 概念


在今天,较为成熟的数据分析部门一般会基于三个维度来评估其底层数据的质量,并发挥数据分析的业务价值。这三个维度包括:指标数量、可关联指标数量、指标记录的内容量。

这些维度对于数据分析人员来讲并不陌生,其中第三个维度正是上边所说的数据量,在本文中就不多说了,我们主要另外两个维度来看。指标数量即系统中记录了多少个不同的指标名称。举个例子,以网站的游览情况来说,我们会记录包括PV(页面访问量)、UV(独立访客数)、跳出率、转化率等;或者从销售的角度来看,可以有客户量、新入客户量、消费时间、消费金额、购买产品等;或者再从客户服务的角度来看,可以有通话量、通话时长、排队时长、一次解决率、满意度、投诉率等指标。那么在上述案例中,针对网站的游览情况,网站系统中记录的网站游览指标的数量就是4个;销售系统是5个;客服系统是6个。

但是这些单一指标的业务价值其实不大,如果想要发挥数据的价值,那么我们就必须懂得如何利用指标间的关联,当对这些数据做报表呈现时,我们就需要给他们增加关联的数据指标了。最典型的案例是,我想知道不同地区店面的销售对比情况,我就必须要将店面,地区,和销售额这三个指标内容关联起来,如果只单独看其中的任何一个信息,我们都没有办法得出结论。

所以更多的指标数量和更多的可关联指标数量是数据分析的重点,之所以说当今时代是数据的时代,主要原因并不仅是单一的指标记录的内容量有所增加,还有现有的指标中可关联的数量以及数据库中记录指标数量在急速增长中这两点,它们所带来的将是客户行为乃至客户体验的全面量化。

② 可关联指标发展影响


目前针对指标可关联数量这部分,随着越来越完善的客户身份的识别能力,越来越多的企业开始着手于对自身数据库地持续完善工作中。原来如果一个客户在电脑公司官网上看其产品的话,那在该公司的网络部门中将会为其记录一个“IP地址”,并针对这个“IP地址”加上游览时间,游览页面等关联数据,而当其在诸如微信或QQ上查看资讯时,则客户的身份会在其他渠道的系统中重新生成一个独立的身份数据。而当客户选择从实体店面购买电脑时,店面又会在销售系统中生成一个“销售ID”,并记录销售信息,同时与销售时间等指标进行关联。而当客户之后再来寻求服务的时候,我们企业的客服部门则会再重新给他设定一个“服务流水ID”,可以看到在各个部门当中,基于上述所说的识别标签,企业会在各个系统中追加大量的相关指标,诸如时间,地点等,但是这些指标只能服务于某一个部门,无法实现跨部门指标的关联,因为“IP地址”、“服务流水ID”和“销售ID”之间没有关联。

也就是说,如果我是那家商店的高层,我想知道客户一般通过哪些渠道获取信息,之后多久会选择哪条渠道进行购买,买完产品多久之后,会产生服务需求,产生哪些服务需求,针对不同的服务需求,在此之后有多少客户不再与企业产生交互,而又有多少客户在多久之后在什么渠道上看了我们公司的什么信息,之后又产生了什么后续的行为等等等等。而在当时,这些部门能回答我的只有一句话:“我缺少其他部门的数据。”因此可以看到,在割裂的数据支撑下,企业是不能全流程全场景地分析客户,也就难以提升客户体验。

而今天随着企业不断提升对于数据的重视度,客户身份识别也开始逐步完善起来,最明显的就是今天无论你到哪家企业,一旦你决定成为他们家的客户时,企业一般最先做的就是请你完成身份记录,将客户的基本身份信息在系统中记录下来。而比较先进的企业还会通过会员管理,持续通过激励措施来让客户把诸如微信、微博、QQ等相关的身份标签信息都记录到系统中。通过关联这些指标,企业就能形成在内部可以唯一识别的一组“客户ID”,而它就能够跟各个部门掌握的所有指标再进行关联了。在这样的基础上,如果今天我再问上述问题的时候,那么我就能获得一个准确的结果了。

③ 指标数量发展影响


在已有指标的全面关联的基础上,可以说企业终于能够将已经沉睡在数据库中多年的数据发挥出其应有的价值了。不过这还没完,前边我们把旧有指标的关联大概做了介绍,那么新增指标呢?

一方面随着企业对于客户身份记录的进一步完善,我们可以更多地增加客户属性指标,如性别、生活爱好、工作类型、家庭关系、业务偏好、渠道交互偏好等等。而另一方面随着文本挖掘,图像分析等技术的逐步完善,我们惊奇地发现以前难以记录的一些非结构化的数据突然可以放在数据库中了。舆情分析系统就是个典型,通过对情绪词汇及特定业务词汇的识别,舆情分析系统能够对互联网渠道中杂乱无章的内容进行分析挖掘,对客户各种的评价进行正负面影响判别,形成舆论得分指标,而且还能基于客户发布内容总结其交互感受内容、产品功能偏好、需求偏好等具有独立业务价值的新指标。

④ 底层数据对数据分析影响


随着已有可关联指标的数量增加以及新指标数量增加带来的底层数据发展,今天数据分析能够带来的业务价值将无法想象,因为在所有这些指标和指标关联的基础上,企业能够看到的就不仅是单一的客户身份,交互动作或者客户特点了,而是通过把这些内容综合起来,让企业能够看到一个完整的人,提升到一个完整客户体验的层面了。而如果此刻我是这个企业的高层管理人员,我将不仅能够知道每个客户对于以往的交互及产品使用感受好坏,还能知道影响他们感受的原因是什么,甚至还能知道不同类型的客户有什么爱好,对现有产品还有什么需求,希望我们将来能够提供什么产品、什么服务来满足他们等等。至此可以说,企业第一次拥有了能够全流程,全场景的跟踪客户行为的能力,原先割裂的、不完整的指标才终于联合起来,并且企业对于客户行为的认知也才终于完整起来,而这些数据能够带来的价值将成为影响这个企业战略决策层面的价值。

总结下来,在底层数据层面,基础是指标的数量和指标记录的内容量,而数据价值发挥在于可关联指标的数量上。

切记,当一个指标与另一个指标关联后,就绝不是简单的两个指标,而是具有多种特定业务意义的一组数据了,它将能够实现一加一大于二的价值。而当全面的客户数据都够能关联起来分析时,那将会是对于客户理解的全新时代,正可谓是数据分析时代。


本文为作者原创作品,欢迎直接微信转发。

转载时需在文章开头注明作者和“来源鹈鹕全面客户体验管理(微信号:CEM-tihu)“,文字颜色为黑色,且不得修改原文内容。

欢迎小伙伴投稿合作,具体请联系:孙女士sunjz@tihu.com.cn