对不起,你们看重的那些都是虚荣指标
编者按:在这个数据为王的时代,人人都看重指标。但指标也份好坏。用户数、下载量、DAU、PV、点进率……如果你只对那些虚荣的指标感兴趣,则迷恋于镜中的自我就会错过周围正在变化的世界。这就像那则著名的猴爪寓言一样,有时候,当你把焦点放在虚荣指标时,你就会得到噩运。真正应该追求的应该是能指引产品方向、并帮助公司做出更好的决策的明确指标,这样的指标才能带给公司独特优势。跟数据打了30年交道的数字可视化分析公司Looker创始人Lloyd Tabb在接受FirstRound专访中介绍了他的经验。值得各位认真研读参考。
我们对虚荣指标的喜好由来已久。就拿学校来说吧,大多数学生在这个地方都会收到分数。“A”是不是真的反映出一个学生将来的表现或者表明谁更擅长学习呢?得“B”是不是说你得“更努力”而不是“更明智”呢?
分数很容易就会陷进虚荣指标的领地,让人重视攀比而不是进展,带来自负而不是演变。会变成老师用来比较学生或者学校委员会评估学校的工具,而不是学生用来改进自己的工具。让人很容易就沦为“A”的牺牲品。
Looker创始人兼CTO Lloyd Tabb发现技术界也有同样的现象。从日活用户数到收入增长,这些指标可以有效地与其他公司相对比,但对帮助它们运营得更好未必有帮助。实际上,这些指标往往偏向于投资者想要的,表明公司是不是有价值,而不是如何可以创造出更多的价值。
事实证明,我们大多数人依然沉溺于拿到那个“A”。30年来,Tabb一直在LiveOps、Netscape以及ReadyForce等公司领导数据团队,他总结出来最大的经验教训你可能没想到——也不希望听到:你衡量的是错误的指标。
Tabb在接受FirstRound专访中分享了他对指标的看法,介绍了如何去遵循能引领方向而不是迎合喜好的指标,这样公司才能以对自己最必不可少的东西为参照采取行动。他以服务、广告、软件以及电子商务等几种类型公司为例,对比了虚荣指标和明确指标,说明如何寻找可随时间转移更好预测行为的代理。最后,他还强调了如何防止团队受到虚荣指标的诱惑,并提供了如何锻炼直觉、找到真正有生产力指标的技巧。
虚荣指标与明确指标
对于学生来说,GPA和SAT是进入大学的关键。这两个是反映总体表现的单一手段。类似地,你也需要像用户数这样的宽泛指标来说服投资者和顾问来相信你的公司。这些指标服务于某个目的,只是不是适合于每一个目的。Tabb 说:“虚荣指标也不是一无用处。它们有自己的用例,但这只是给别人用来作为比较评估你的公司的。内部不要把焦点把到这些指标上面。而跟踪明确的指标可成就伟大的企业。”他把虚荣指标与明确指标的差异总结如下:
虚荣指标是表面指标。它们往往比较大而泛,可以给人留下印象,比如下载数。可以用这些指标来谋求建立合作关系并赢得一些关注。
明确指标是运营性指标,比如产品每日实际使用时长,用户访问服务所需时长等。这些是推动增长的隐形引擎。要用这些指标来巩固你的竞争优势。
混淆这两种指标有可能会引起灾难。公司有可能会过于痴迷虚荣指标而导致无法建立可行的业务策略。Tabb说:“2014年,一个招聘平台通过用户注册后给其Facebook好友发电子邮件而获得了病毒式传播。顾问和投资者向他们施压要提高日活用户数(DAU)。于是他们把全部的焦点都放到这上面。这项策略奏效了:3300万用户吸引到了4900万美元的融资。这一切都是在不到2年的时间内实现的。但他们太过关注于这一个指标了,以至于并没有意识到自己正在以同样的速度失去用户,因为在这个过程中把每个人都惹毛了。最后这家公司就像流星一样昙花一现。”
用虚荣指标给你的车加满油你也许可以跑得很远,远到可以拿到一笔投资,但最终你会用光里面所有的油。在把焦点放到对单元经济不利的增长之后,那家公司再也无法恢复元气。Tabb说:“这就像那则古老的猴爪寓言那样。一位父亲发现了有魔力的猴爪,可以许下三个愿望。他的愿望是得到200美元。结果他在工厂工作的儿子因为事故死亡了,然后父亲收到了工厂给的200美元抚恤金。你得到了自己想要的,但福兮祸所伏。有时候,当你把焦点放在虚荣指标时,你就会得到猴爪。”
那么哪些指标才是真正的指标呢?以下就是Tabb的建议,按照集中商业模式进行分类:
服务型公司
如果你是卖服务的,你的虚荣指标通常来说就是服务的使用人数。拿你的增长率跟竞争对手比较可以发现谁获胜但揭示不了原因和手段。Tabb说:“对于服务型公司来说,要找到并衡量可让你捕捉客户满意度的指标。你的目标是回答这个问题:我们的客户有没有得到好的服务?我知道这个问题的挑战性,因为服务是主观性的。一旦你找到一个好的代理,要持续衡量行为。行为有没有该生改变?如果它变好的话,你的业务也会变好。”
怎么才能找到那些代理呢?跳出所在行业也许有助于你更加开放更有创意地进行思考。比方说,想象一下你要评估饭店的服务好不好。Tabb说:“衡量服务是否周到有很多昂贵的手段。比方说,你可以算一下有多少人试图联系服务员。但这未必说明问题,因为你不知道他们是想引起关注还是对同桌的人感到厌烦。没有通用用途的衡量手段。你需要的是容易识别又不容易引起误解的手段。选项之一是你可以衡量所有杯子的液体水平。在任何时候杯子够不够满都是衡量总体服务的很好指标。这是一个可靠的手段,因为这容易计算,也容易持续观察。”
盯住服务的最早期行为。明确指标可预测未来。对于服务型公司来说,要尽早盯住那些指标。就拿汽车共享服务来说吧。月活跃乘客数就是经常被提到的指标。但Tabb说:“可这是个虚荣指标。它解释不了为什么客户会不断回来,也没有告诉你应该如何改进服务。要想改善服务,你得看载客所需时间。车子抵达越快用户越有可能再次使用你的服务。等1分钟跟等10分钟的不同明确反映出服务质量的差异。数据的分析可能会告诉你等待时长的分水岭,一旦超过那个时间服务就会变得不可接受。按照实际、区域等维度跟踪等待失效可以逐步改进客户满意度并且增加回头客。”
这个经验对于Tabb来说尤其可靠。Tabb曾经在虚拟呼叫中心公司LiveOps折腾过一年数据,试图找出如何预测坐席代表质量的办法。因为坐席代表和客户的不同,每次呼叫都是不一样的。他说:“我试过测试呼叫时长。我的假设是如果呼叫很短的话,说明解决问题更快,所以这个客服代表水平也就更高。但这并不是一个很有说服力的指标,因为这不能预测服务的品质。后来我又试了坐席代表做成额外销售的呼叫占比。当然,这个只能预测收入,而不是服务。”
后来他才灵光一现。LiveOps所有的坐席代表都是独立承包商。什么时候工作(露脸)是他们自己选择的。Tabb说:“于是我盯住可衡量的最早期行为:上线率。我们开始跟踪谁冒头谁没有。结果表明,上线率是责任感的很好代理,是坐席代表最好的衡量手段。这个指标并不明显。这甚至都不是发生在呼叫过程里面的东西。这是性格的衡量手段——而我们有数据支撑。但是我们必须找到合适的代理,因为这方面并没有衡量好坐席代表的标准手段。成功的最好指标是你是否做了所承诺的事情。我们开始把话务引导到最好的坐席代表(也就是言出必行的那些),然后我们所有客户的收入都提高了。”
广告型公司
按照Tabb的说法,广告型公司极易受到虚荣指标的感染。但广告效果代表的是曝光率而不是结果。而且也不能预测行为。
Tabb说:“有太多的公司经历过惨痛教训才知道用户归因才是真正重要的东西了。如果你不在同一个数据库内跟踪点进率和购买指标,你最后得到的只是点击了广告的用户占比。你不知道后来他们做了什么。访问你网站的人可以有100万,但他们可能没有一个人会买你的东西。平均值也是个肤浅的虚荣指标。在没有上下文的情况下,这个指标会让人质疑为什么。”
用户、点击、交易等等,你衡量的这些东西本来就是共存的。所以为什么你要单独把它们隔离到不同的数据流去呢?
Tabb对这种数据隔离的做法发出警告。他说:“你的指标都是相互影响的。你需要监控它们是如何相互影响的。不要光衡量哪些点击生成了订单。要给它补充数据并进行分解。从用户与你的第一个接触点,到他们在你网站的行为乃至于实际的交易等等这些都要跟踪。一路下来你必须建立好关联。”
如果你们是电子商务公司,还得更进一步。Tabb说:“一旦你获得一个用户,要把他归属到特定的用户来源,记录获客成本,以及回收获客成本所需的时间。不要停留在表面上。哪些点击是买下来的。你需要知道。这是你真正了解客户生命周期价值的唯一方式。我们曾经跟一家网上时装分销商合作,他们提供了很多附赠品,后来他们发现一旦新注册用户行为类似正常客户时,回收那些附赠品的成本并不需要太长。但免费是危险的。他们目睹过各种坏行为,那些新“客户”大多数从来都没有转化为更正常的行为。只是因为他们从点击到获取乃至购买一路都跟踪下来才发现了这一点。”
把你的数据组织为事件流。隔离的数据会掩饰真正的指标。Tabb说:“首先,要把用户活动和里程碑集中到单个数据流里面。事件流显示出大家在你的产品内是如何流动的,并且还可以让你分析他们的行为。对于很多人来说,这却不是自然的选择。公司往往按照人口统计归属来对用户进行分类,然后把数据做进独立的交易表里面。当然,独立的表读起来更容易些,并且能让你的软件有效。但这并不能为了解这个过程当中的用户行为提供全面的视图。”
事件流的一个例子
从回答以下问题开始构建你的事件流:
用户什么时候注册了我们的产品/服务?
他们有没有购买东西?
他们在我们身上花费的活跃时长是多少?
他们在什么地方花的时间最久?在什么地方花的时间最少?什么样的代理预测了这一行为?
他们的行为是如何随着时间而变化的?
他们什么时候在什么地方停止使用我们的产品?
Tabb建议在建立了事件流之后尝试一次简单的练习。Tabb说:“计算用户每天在你身上花费时长超过5分钟的活跃时间段数量,然后在他们的行为当中寻找集中的动作以及不活跃的时间片段。这是理解客户实际在做什么的廉价手段。他们花费大量时间的一个网页上是因为感兴趣还是感到困惑?如果他们在进行购买,做出实际购买前他们访问了多少个网页呢?如果你不按照事件流中的时间安排好你的数据,就永远也不能回答这些问题。”
软件型公司
不管是app还是SaaS平台,你在推出产品的时候,用户数都是产品市场匹配的核心,也是对投资者、合作伙伴以及顾问的关键卖点。但Tabb却提出了一个相悖的观点:你下载的软件当中有多少是没用过或者只是用了一小段时间然后束之高阁的呢?他说:“下载你产品的人数跟你的公司生存并没有关联。有多少app是突然获得了病毒性流行然后在数月甚至数周之内销声匿迹的呢?软件公司需要关注的是活跃参与(Active engagement)时间。这个才是明确指标。”
活跃参与时间是Tabb在Looker衡量的第一个指标:大家每天在他们的软件上面花费的活跃分钟数是多少?他说:“我不关心收入或者用户数。当我们获得一个新客户时,我需要知道他们是否实际使用了我们的软件。虚荣指标很容易就会误导公司。你可以吹嘘说某客户员工90%都登录进去了,但这些当中有多少是实际使用了的呢?如果他们的确用了,他们有没有积极地浏览呢?还是仅仅晾在后台不用?账户数也是一样。账户数并不能告诉你大家是如何使用你产品的。有时候你甚至得打电话过去问才能知道。”
致电异常者。Tabb每次发现Looker用户群里面有离群值时都会找到那位客户的联络信息并打电话过去。在早年期间,他每天都这么做。Tabb说:“我打电话是因为我想知道他们对使用我们软件的感受如何。如果他们并没有在使用Looker,我想知道原因是什么。是不是什么东西出问题了?他们是不是卡住了?如果他们是活跃用户的话,我想要了解他们的体验以及我们如何加以改进。我是在LiveOps的时候学会要给异常者打电话的。当我注意到有一组电话在统计上比较怪异时,当时的我正好有这个奢侈的条件可以随便打电话。比方说,有一位坐席代表的电话特别的长。我可以看到那位坐席代表语速缓慢,但另一头的客户的确很热情,甚至比其他电话都要投入。这种情况下,打电话久并不是坏事。”
在Looker早期阶段,Tabb会查看缺少互动的情况。Tabb说:“当我注意到我们首批客户中的一家的CEO刚刚打开了我发给他的几个书签但并没有翻看里面的数据时,我就去找他了。结果表明,他并不理解Looker的界面是怎么操作的,而且有这种情况的还不止他一个人。为此我最终对整家公司都进行了培训。在培训之后,那家公司的人对于挖掘数据感觉就舒服多了。这改变了我们接近客户的方式。”
Tabb发现大家经常犯的一个错误是过于信赖A/B测试,指望用这个东西来解码隐藏在数据里面的模式。Tabb说:“总会存在例外。A/B测试在特定情况下是有帮助的,比方说当用户没有在网站上亮明身份时。这类测试可以帮助识别本来是匿名的用户。但绝大部分时候这并没有什么作用。首先,如果你的数据是孤立的话,A/B测试会告诉你最直接的结果而不是长期结果。比方说,通过把“关闭”按钮的大小减小我们发现点进率翻番了,但这可能是因为用户本想想点关闭的却误点了其他的地方,但这些点进最后都没有转化。即便你有几十亿用户,如果数据是孤立的话你也无法从中找出任何实质。相反,不如把精力放在研究客户的事件流。致电给个体用户。现在就开始。经常地做。拿起电话开始真正的对话。”
软件让大家用新的方式思考和行事。A/B测试是在缺乏交互的情况下进行监控。放下你的望远镜,拿起电话吧。聚焦活跃参与的另一种办法是缓解妨碍用户使用你产品的东西。尤其是要跟踪这两个指标:失败率和中毒率。以下是办法:
找出然后大幅削减你的失败率。失败率是你的公司未能如期交付的次数。失败率是所有企业都适用的运营指标——不仅仅是安全方面。Tabb说:“要想找出公司的失败率,首先找出每个部门的失败率。每一项职能都会有不同的失败率去苹果他们的工作。对于客户体验来说失败率是客户体验代表无法解决客户问题的次数。对于供应链来说,是客户尝试购买已售光的货品的次数。每一个团队成员都需要知道和监控自身特定角色和部门的失败率。每一次你变更自己的流程或者产品,对失败率的衡量也要相应调整。如果你刚刚起步,可以采用免费的工具来识别失败并找出模式。让你的web开发者使用Google Analytics来检查404错误或者内部服务器错误出现的频率。让支持部门使用免费调查工具来调查支持请求样本的满意度情况。”
失败率不属于性感的的外部指标,但它能让公司头脑清醒。Tabb说:“曾经有一次移动支付公司Venmo做出了一次设计变更,使得用户很容易一不小心就会在不想这么做的时候转钱出去。一方面这会推动交易数等虚荣指标变得好看,因为每一笔错误转账都需要多一笔转账来抵消错误。但对于内部来说这却是个灾难。用户很容易迷惑,无法按照自己意愿控制他们的支付。Venmo找出了那些特殊的交易对——也就是支付出去然后‘反向’转账回来的交易来测试新设计是不是导致这种现象出现的根源。团队的假设是正确的,后来他们纠正了问题。”
失败率防止小的裂缝变成断裂。虚荣指标很少具有预防性。奖励你的中毒率。作为失败率的子集,中毒率是指客户的初次体验太过糟糕以至于再也不回来了。Tabb说:“这类似于你在饭店遇到了食物中毒。有过这样的体验之后客户几乎不可能再回来了。公司很少衡量中毒率,但在努力控制用户群的增长时这个指标可以是非常强大的杠杆。你失去的不仅是一位潜在客户,而且可能还会失去他们可能会推荐的人。在社交媒体时代,中毒是很可怕的。”
这方面市场(marketplace)的风险最高。Tabb说:“就拿Airbnb来说吧。特定的租户会不会有很高的中毒率呢?这个地方可能有很好的特质:大小很好,位置极佳,价格还有竞争力——但在那里呆过之后大家就不再使用Airbnb了。现在我们有一个有效的明确指标或者是另一个指标,比方说每租户的预定停留数。这个东西是一个虚荣指标,除非你挖掘进去找出该租户实际上是不是在损害你的业务。有很多因素是超出你对市场的控制范围的——找到来,奖励你的中毒率。实际上这会帮助你给混沌带来一些秩序。它让你可以理解你的期初损失,知道这种损失是不是可以用收入弥补回来。”
电子商务公司
电子商务公司是讲究忠诚度的公司。要想赢得市场,你需要客户不断地选择你而不是竞争对手。Tabb说:“电子商务拼的是机会成本。你必须找到并衡量可激发客户不断订购的代理。重要的是客户购买的频率,而不是购买的额度。跟购物篮大小或者收入相比,真正的指标,比如围绕装运和递送方面的指标没那么性感,但却推动着重复的行为。”
Tabb说:“Amazon就是一个很明显的例子。从外部的角度来看,Amazon Prime是一项忠诚计划。免费的2日送达会不会让你购买更加频繁?绝对会,Amazon知道,如果你总是能更快地收到网购的东西,当你需要什么的时候就会回头再去它那里买。他们是对的。Prime会员每年的平均消费是1200美元。非会员的支出则是500美元。”
早期的时候Netflix也信奉类似的指标。该公司发出一份调查在邮件里面询问用户希望哪一天收到DVD。“他们衡量递送时间,看看是不是需要建立更多的分发服务中心来减少送货时间。Amazon可能也在做同样的事情。该公司专注于超额实现承诺而不是收入。他们投资于货运飞机和无人机,为的是永不止步地超出你的期望。”
大力投入物流提升忠诚度。每一家公司都有跟物流绑定的明确指标。其目标是建立可靠性消除惊吓。这可以建立忠诚。
回答以下问题来找出物流相关的真正指标:
哪一位客户订购最频繁?
他们有何共同特质?
当他们开始订购更多东西时你能识别出一个明显的转折点吗?
如何才能强化你提供给他们的产品?
你可以开发哪些功能来激发其他客户产生类似的忠诚度?
形成你的数据感
每一家公司都有自己的虚荣指标——以及明智指标。放心,你已经有了可帮助你分辨差异的数据。你只是需要训练自己。先从提升可以预测客户个体行为的指标开始,而不仅仅是为了跟竞争对手比较而捕捉一份汇总的快照。把你的事件流组织起来,按照时间顺序了解大家如何跟你的产品互动以便可以测试其中的部分。数据无法告诉你大家是怎么想的。要确保每一个部门理解自己的失败率并且准备好降低这个指标。你的物流是企业的关键杠杆。教会你的团队如何抽取和看待数据。你需要一个数据侦探团队,而不是让福尔摩斯单打独斗。
Tabb说:“娴熟运用数据不再只是技术的事情了。客户支持、设计、业务开发等等,每一家公司的每一个部门都必须投入进去。他们应该分析数据找出代理。当他们发现异常者时,要做好准备深入挖掘原因。哪怕你的数据团队少了一根线你也没法衡量。对你的事件流进行自动失灵分析展示给你的数据科学家看。让大家跟进数据团队或者把数据科学家嵌入到设计、客户支持等团队里面。我把大家能够利用数据的世界等同于可通过Google查找信息。当你刚开始使用Google时,学会如何从中找出所需的东西是要花时间的。最终,你学会了如何得到自己所需——当你做到这个时,你就有了这个令人吃惊的点进世界观。在数据方面,大多数公司还没有突破‘搜索结果的第一页’。但现在,这不是现实而是选择。不要停留在虚荣指标了。迷恋于镜中的自我你会错过周围正在变化的世界的。”
作者:译自:firstround.来源:36氪
转载请注明:电商回忆录 » 对不起,你们看重的那些都是虚荣指标