数据思维
荐语
你将获得
作者简介
精彩选段
读完本文约需6分钟
以下为《数据思维》音视频演讲实录的部分内容,成为樊登读书APP的VIP即可获得全部内容。
樊登:前两天我拿到了一本书,题目特别好,叫作《数据思维》,副标题是从数据分析到商业价值。我觉得,未来大数据会像电一样会成为我们的一个基础设施。所以,每一个在现代生活的人都得具备数据思维,否则的话你会吃大亏。
我就说一定要把这本书啃下来讲给大家听,结果翻了一下发现看不懂,因为里边好多数学知识。虽然我原来数学也不错,但是真的是已经远离了。好在这本书的的作者王汉生教授,他是北大光华管理学院的统计学著名的教授,也是我们樊登读书会的会员。他特别开心地来到我们作者光临,给大家讲讲最近的这本新书,叫《数据思维》,欢迎您王教授!
王汉生:谢谢樊老师,非常荣幸能到这儿来。因为我自己就是樊登读书的会员,我跟樊老师,还有很多朋友都讲过。我自己是个理科背景的人,尤其在宗教、美学、人文方面的素养特别差。樊老师给我分享了很多,我学习到很多特别好的东西。这次也是一个特别好的机会,所以来当面说声“谢谢”。
樊登:太开心了,能影响到北大的教授,我真是三生有幸。
前两天王教授写了一篇文章,里边写到在光华管理学院教统计学是一件非常困难的事,非常有挑战性。因为底下坐的都是些大佬,都是些企业家。他经过很多这样的商业的行为,老师们没有干过这事,所以经常会被底下的学生挑战。那您讲这个可以说有点枯燥、有点难懂的统计学,是怎么说服那些企业家能够开开心心地听下去的?
王汉生:这个是一个慢慢成长的过程,第一次上课的时候,自然是非常有挑战性的。我曾经跟我们的年轻老师们开过一个玩笑——因为我们有统计系,我是统计系的教员。我们还有营销、战略、组织行为、经济学、金融学等等。我说:“你们是没有吃过猪肉,但是至少见过猪跑的。”
这就是说,即使有一天,年轻的老师从来没有跟企业有真实的合作经验,那么,至少当你是学生的时候,当你读研究生的时候,你的老师会给你讲非常多管理学大师的经验和教训,有很多案例。我的背景从小到大是偏数学的,属于没有吃过猪肉,连猪长什么样都没见过的。
那对我来说,这自然是个很痛苦的、漫长的、历练的过程,经常讲着讲着挺高兴的——讲个啤酒尿布的故事。同学就举手说:“王老师你讲得好像很有道理,你干过没?”那很尴尬。
很客观地说,我就只能当场认怂,说“这故事我也是听来的,我也没有干过”。看人家怎么看这件事情就是了。
当时对我来说可能有两个选择,一个是这学生太调皮了,算了,以后换一个高大上的,把他糊弄住。另外一种就是我直面这个痛苦,我要解决这个问题,所以我就从2003年到光华,现在2014年,这11年中我非常近距离地看我们中国的数据产业是怎么样一个个变化起来的。
当然非常幸运,北大光华有一个特别好的平台,我们自己的MBA同学、EMBA同学、ExEd的同学都非常优秀,跟他们能学到很多东西。在这个过程中慢慢地去理解在中国的制度环境下,我们的数据是怎么样变成商业价值的。从这些我们合作中产生的案例,再到课堂上的时候,那就好太多了。
樊登:今天您的任务其实也挺挑战的。咱们只有不到一个小时的时间,您要给这么多的书友普及一下数据思维到底是怎么回事。那咱们就先从这个定义开始,您觉得什么叫数据思维?
王汉生:这是一个特别好的问题,先说我们如果在百度上搜“数据思维”四个字,那么会跳出一堆一堆的东西来,让人怀着无限的敬意。我想人家说的也是数据思维,但是可能跟我讲的不大一样,没有半点理由说,我说的就是对的,人家就是错的。那在我的脑袋里,数据思维关心一个核心问题——我常常问:同学们,我们为什么要做数据分析?是为了追求高大上吗?是为了追求茶余饭后讲点段子吗?
不是,在商业实践中,我们做数据分析的唯一的目的是要解决业务问题、创造商业价值。所以,数据思维在我这里,就是用了四个字总结了我这十几年摸索的一套方法论。什么方法论?让数据怎么变成商业价值,这是我说的数据思维所代表的核心的问题。
樊登:这是一个定义,那具体来讲数据思维有哪些方面?
王汉生:我把它总结成三个方面的内容。第一个就是我们要深刻地理解数据和价值之间的关系。这里的价值我指的是商业价值而不是科学价值。因为数据之于科学价值,可能是从亚里士多德到牛顿那个时代,大家都知道的,不言自明的。
但是商业价值很重要,为什么?我们如果说,不清楚数据与商业价值的关系的话,数据产业也许就是一个空谈,所以,第一个,我们要关心数据和价值之间的关系。
樊登:那这个关系的建立,您有没有一个案例?
王汉生:我们举一个特别具体的例子,中文的文本是不是数据,我们肯定会认为点评是数据对不对?那为什么跟中文文本相关的数据分析的产业和商业产品,是在过去的20年差不多也才兴起的,才变得热火朝天的?它跟我们技术的进步是有关系的。
樊登:按理说古代就该有,但是没有。
王汉生:那时候没有技术手段,所以,在我脑袋里我给了它一个非常狭隘的定义,但这个定义可能带着个人的偏见。但这个定义帮助我们比较轻松地理解数据的商业价值。
什么是数据?在我的脑袋里凡是可以被电子化记录的才叫数据。其他你也可以定义数据,但那种定义对于我理解数据产业的商业价值和它的发展帮助不大。从这个角度看,数据的定义有着非常强的时代特征。因为不同的时代赋予我们不同的技术手段,所以,1000年前图像不是数据,现在是了。1000年前可能文本声音都不是数据,现在都是了。
如果我们有一个这样数据的时代观的话,它自然而然产生的一个问题是:在未来什么东西会变成数据?那么,这应该是在投资和产业发展中很关心的问题。未来还不能扯太远,太远了没有意义,可能我们自己都已经不存在了。未来的四年到五年,这是一般的基金它要求回报的一个自然的周期。那么,在未来的四到五年里,什么样的东西正在变成数据,这是我们关心的一个特别要点。
樊登:就好像我们原来认为堵车这事不是一个数据,但是现在堵车可以非常完整地呈现出来;出租车过去是想往哪儿跑就往哪儿跑,现在有了滴滴以后它变成了数据;OFO把自行车数据化了。那将来还有什么可以数据化?
王汉生:这些全部都是依赖于我们技术的进步给它们提供了机会。樊老师您正好提到特别好的例子。我们现在说图像是数据,这好像已经是过去时了。那么,您提到OFO、提到了滴滴,这些都跟有一个基础的技术是相关的,就是跟我们的车联网、物联网的技术成熟相关。
我们自己的团队非常幸运的是亲自经历了这个过程。大概两到三年前,当我们谈到车联网的时候,我们可能还认为是一个理念,因为在国外的媒体上,我们能够看得到。
那么,在过去的两三年里,我们亲眼看到我们自己的中国有很多优秀的创业团队陆陆续续地起来,他们把技术做成熟了。现在无论是大卡车也好,小汽车也好,或者自行车也好,都能够大量地采集这样的数据了。
但为什么我说它是进行时,这条路似乎还没有走完?因为技术成熟之后,它的商业化还没走完,仍然是一个巨大的问号,我们看到的情形是在国外,比方说这种车联网数据的商业化的一个重要的手段,可能是这种保险,叫作Usage Based Insurance(驾驶行为保险)。
那么,在中国好像是这条路是挑战重重,未来的出路在哪里,我们都在拭目以待。这就是个特别好的例子,它的数据带有强烈的时代特征。
樊登:这就解释了为什么从数据能够变成价值,就是在保险业当中,只要我能够获取更加准确的信息,我的保费就可能会更低。
王汉生:有可能,而且你的利润率还更高。
樊登:或者对某些人我就得收更高的保费。因为你过去没法区分,所以造成了大量的社会交易成本,这是第一个方面的数据。
王汉生:刚才樊老师您还提到另一个很重要的问题就是价值。价值到底是什么?我自己这本书的第一章叫作《朴素的数据价值观》。我特别提到了两个字“朴素”,我觉得我不大喜欢随着一般的媒体说大数据四个“V”。我要是给它整五个“V”是不是更厉害?没有太大意义。我们的这些媒体,或者说我们经常怀着无限的好奇心讲谷歌的故事,讲亚马逊的故事。
我不知道樊老师您有没有这样的感慨,我们看这个故事会热血沸腾,回过头来这些书之于樊登读书的运营有什么帮助,我觉得很难落地。
所以,这些年的思考,让我琢磨透了一件事情,别人家的故事跟我没有太大的关系,数据之于我的价值一定是关乎我们自己业务的核心诉求。它要解决我的业务问题,比方说,我常常开个玩笑:我是北大东门卖豆浆的,我每天的豆浆销量是100碗。您跟我讲有大数据产品怎么高大上,跟我没关系。你可以告诉我通过什么样的数据分析告诉我怎么卖豆浆,我这个豆浆销量每天从100碗变成150碗了,多出了50碗。这是可见的收入上的价值,咱俩分,给您20碗,你喝10碗倒10碗我不介意。但是你给我讲谷歌的故事、讲亚马逊的故事、讲淘宝,跟我没有关系,对我没有用处。
所以,我说价值是什么?价值一定是关乎我们自己工作运营中最核心的业务诉求,这是我对价值的定义。
樊登:这两个概念我听懂了。第一个是能够被电子化记录的是数据,这些数据能够对我们本身的核心业务产生影响的叫作价值。这是您说的数据思维的第一个方面叫作从数据要到价值。第二个方面呢?
王汉生:那现在是说,你看,我们现在知道数据和价值了。这条通路怎么建立,它怎么从这儿就变到这儿来了?我跟您分享一个真实的故事,特别好玩。
有一次,我参观一个很大的企业集团,然后对方有一个大数据部,集团非常重视,然后对方也特别慷慨,跟我们分享了特别多好玩的故事。他们做了很多漂亮的分析,我不是有朴素的数据价值观嘛,我这人总是捣乱的。
我就问了个问题,我说:“咱们做得那么好,这些分析支撑了咱们集团的哪些业务?”
您猜猜别人会说啥?他说,“我支持了所有的业务”。这好像不大可能,这太牛了。但我没有任何能力去反驳别人。然后他们旁边另外一个事业部的老总当场就拍桌子说不对,你们对我们的帮助就不大,我们就没有体会到你们这个大数据部对我们有什么帮助。当场给人打脸,别人就生气了。这边说:“你提需求,你怎么不提需求?”,然后另一边说:“我不会提需求,我不知道你们是干什么的,我提不出需求来。”
我每次在我们的高管课上讲这个的时候,常常下面笑成一片。因为这是几乎每天发生在我们企业中的故事, 你为啥做不好——你不提需求——我不会提需求。那我们看到在这个让数据产生价值的过程中,最挑战的一点在哪里?不是技术分析,不是深度学习,不是人工智能,而是我们缺乏这种数据思维的能力,能够把一个业务问题定义成为一个数据可分析问题。
从这个位置往下,可能是像学统计学、学计算机这种专业的数据,科学人才就能做了。但是,把业务问题定义成为数据可分析问题,只能是业务中的管理者和负责人才能定义出来,因为别人不懂您的业务。所以这是我们看到的,要让数据产生价值的第二个核心的通路,我把它叫作回归分析。回归分析是我们常常在数理统计学上讲的X和Y的关系。但是,我把它抽象成一种理念,我认为这是特别重要的一点。
樊登:那这一步要做到的话需要什么能力,比如说,我要把樊登读书的业务数据化,这需要什么能力?
王汉生:这也是个特别好的问题,你看,第一个咱们说数据分析要解决业务问题。那么,樊登读书是个特别优秀的组织,然后中间肯定有大量的业务诉求,那我们不能一口气全干完。那么,先说一个诉求是啥?比方说,我要增加我的粉丝量,这时我提到了一件事情,叫作我的业务的核心诉求是粉丝量,那我们把它叫作Y,这就是我的核心的目标了。
那么,接下来我们会研究是什么样的因素可能影响到这个Y,可能说季节因素很重要,可能春节的时候大家开心了,那时可能是一个高峰期或者是低峰期,这叫季节因素。每周一、二、三、四、五这也是时间上的季节因素。更重要的是,我相信我们会有市场手段,比方说我在这里有没有分会,我有没有找了某一个行业的代言人等,我会觉得很多因素会影响它,我把它叫作X。
什么叫作数据可分析问题,如果我们能把Y和X七七八八说个清楚,这就是数据可分析问题。从这个位置再往下,我们刚才那位大数据事业部的老总,对他来说就很容易了,它就变成一个纯技术问题了。
樊登:这怎么说清楚?就是我会去观察我的数据,说春节期间是上升了,我就要分析说为什么上升了?
王汉生:不用,您是企业中的创始人,分析肯定不能您来干。你得指方向说,未来12个月,我们这业务最关心的问题是什么?比方说,我们举一个例子,根据您的经验,咱们的文案很重要,那就是文案是个重要的X。
您就指好方向说,这个问题我想研究一下文案是怎么样影响到粉丝的增量的。从这个位置开始,剩下的如果您能交给一个专业的数据分析团队,他都明白为什么。