做数据分析的同学们都见过下边这种矩阵,很多人对此顶礼膜拜,甚至还有一些网文作者直接就把:矩阵思维、矩阵模型、矩阵法招呼上了,说它是数据分析的“底层思想”“核心逻辑”,好吧……肯定他们是没在咨询企业上过班了。其中真相如何。
今天我们系统讲解一下。
1、从平均值法说起
平均数是用的最多,也被调侃的最多的概念。有诗为证:
村头老张一千万
隔壁九个穷光蛋
统计局里算一算
各个都是张百万
但问题是,为啥平均数被吐槽这么多,实际上却又使用的最多?明明统计学里有平均数、中位数、众数三个概念,三个概念都很好理解,但为啥非是平均数呢?
答:因为平均数用起来方便、省事。用平均数,能很简单的把总量按人头分解,比如:
-
销售金额=购买客户数*人均购买量
-
生产数量=生产线数*平均产能
-
备货数=门店数*平均销量
这样在做管理的时候是很省事的:想提高销量,要么增加客户人数,要么提高人均购买。这两个数字可以简单的直接相乘。用中位数、众数显然达不到这个效果。并且,在下命令的时候也很清晰:每个人都要做到平均水平以上!你做不到,你就拖了大家的后腿,大家都能做到你凭什么做不到。你看,简单清晰,而且符合人们的直观感觉,很有说服力。
所以平均数是自带标准的。高于平均值就是好,低于平均值就是不好。这一点对咨询顾问们来说非常重要。因为大部分咨询顾问,在特定行业里的经验远没有客户多。因此诊断问题的时候,咨询顾问们非常需要一个不依赖于行业的、中立的、有说服力的标准来判断好坏。判断完好坏,才能进一步分析为啥好、为啥坏。因此平均值法是用的最多的判断方法。
当然,平均值法也有它的先天不足,这就引申出其他方法。
2、平均值法的迭代升级
用平均数的问题,其实来源于个体差异过大,所谓:“我和姚明平均身高,和马云平均财富”,因此在平均值法的基础上,又引入了二八法:按20/80理论,直接把最好的前20%分离出来,单独观察,避免干扰其他群体,这样也能做出判断。
二八法一般在前台/营销端用的多。因为后台/供应端的生产、物流都是机器化流程,容易把控质量,但前台/营销端常常出现少数能力好的销售做出大量业绩、少数金主爸爸贡献大部分利润的情况。在管理上,进而衍生出:淘金法。即招100个销售,要从里边培育出20个Ace级销售。类似挖一大堆沙,从里边淘出金子的过程。
如果评价维度有两个呢?这就引申出了矩阵法。
3、从平均值法到矩阵法
矩阵法本质上是一种用两个维度来找判断标准的方法。它的操作非常简单:
第一步,找到两个评价维度,每个维度取平均值做判断标准。
第二步,两个指标交叉,把待评价对象。
第三步,根据两维度含义,给出分类解读。
只要两个指标相关性不是非常高,两个指标交叉的时候,数据就会分散在四个矩阵里,这样能清楚找到业务含义(如下图)。
更有趣的是,如果两个评价维度组合得当,是能够解读出很多有意思的业务含义的。比如游戏行业的用户活跃/用户付费两个指标。可以起个:
☆ 高活跃+高付费=金牛用户(又出钱又出力的老牛)
☆ 低活跃+高付费=土豪用户(懒得自己打,爷花钱买!)
☆ 高活跃+低付费=白嫖用户(啦啦啦,就是干玩不给钱)
☆ 低活跃+低付费=边缘用户(都不咋玩,要跑咯)
这样的解读能一下让报告的气氛活跃起来,结合所谓“矩阵模型”,显得即高大上,又活泼,这是甲方爸爸们最喜欢看的东西。因此矩阵模型便大行其道了,每个咨询公司在新员工培训的时候,都会教如何构建矩阵模型,让爸爸们满意。这是一个祖传手艺。
所以你看到的咨询公司的所谓分析模型, 出现最多的就是矩阵,各种矩阵。如果矩阵搞不掂,基本上就是什么7S,9P之类的巨复杂,巨多分类维度的模型了。反应快的同学,看到这立马就有疑问了。“诶?为啥会这样,理论上3个维度的评价,也能这样叠加下去呀,不就是拉交叉表吗。”
以3维度评价为例,即使每个维度都用二分类,那么能分出来的也有2*2*2=8类。这种情况下会出现几个问题:
1、每一类含义解读变得复杂,不见得都能解释清楚。
2、每一类群体数量变少,经常出现一个群体占比50%,另一个占比5%的问题
3、因为群体规模不均,经常引发客户:“我们再细分一下”的要求,结果拆的越支离破碎,解读越麻烦,而且有的客户,就是50%用户消费、活跃都是0,也没法继续深入
总之,原本用平均值法、用矩阵法,为的是简单、省事。现在反而人为的制造复杂性了。所以当评价维度超过3个以上的时候,咨询顾问们会倾向于放弃手动分类,直接用包含一大堆分类维度的综合评估模型。或者干脆上K均值聚类,对着聚出来的结果再拍脑袋解读。
4、小结
所谓的分析方法,都是有特定的使用背景、使用目的、使用效果的。而且并不是所有的分析方法,都是冲着“精准”去的。能快速、省事的解决问题,才是最终目的。