主页 > 报价

#读书分享#《决战大数据—驾驭未来商业的利器》

时间:2019-08-10 来源:一起做游戏

前言选择本书的原因

现在很多人在谈“大数据”。很多人说,大数据拥有无限前景以及钱景。但是大数据的价值到底在哪里?为什么很多人提到大数据,都觉得那是在“讲故事”、“离我们还很远”?事实上,数据离我们并不遥远,过去的数十年,很多行业都走向了“信息化”。而未来的十年将是“数据化”的十年,“遍地黄金”指的则是未来无所不在的数据化可能。为了找到“大数据的秘密”,我针对性地选了本书作为此次的读书会分享内容。

大数据的重要性

科技创新的日新月异,使世间万物呈现互联状态,同时随着互联网技术的普及和深入推广,人类迈入一个全新的思维时代——"大数据时代".它使人类生产和生活中出现了解决问题的新方法 ——大数据.大数据作为高科技时代应运而生的产物,一方面使信息沟通呈现无障碍态势,另一方面增强了人与人之间的沟通.纵观当今时代,大数据已渗透到人类的各行各业,对经济和社会发展起着重要的作用

大数据的应用阶段已经从发现问题、分析问题过渡到帮助企业挖掘更大的商业机会、辅助高层决策了。于此同时,很多企业的数据应用依然停留在表面,不仅错过了大数据蕴藏的巨大商业机会,也没有用数据给企业带来实打实的利润。因此,本书的核心内容是分享作者在数据领域深耕十几年的经验,阿里巴巴数据实战应用的方法论,以及提出了大数据在未来实战层面上的应用趋势。

【作者简介】

车品觉,阿里巴巴集团前副总裁,首任阿里数据委员会会长,畅销书《决战大数据:驾驭未来商业的利器》作者;拥有十几年丰富的数据实战经验,并在实践中形成了独特的数据化思考及管理方式,对大数据未来趋势有独到的见解。亲自领导阿里数据团队在大数据实践领域取得了一系列重要成果,包括为阿里建立集团各事业群的业务及决策分析框架,开发智能化的数据产品,成立了驱动集团数据化的运营团队,成功发起了公共与专有数据资产管理体系,还发布了数据安全规范等。

现担任中国信息协会大数据分会副会长、中国计算机学会大数据专家委员会副主任、粤港信息化专家委员、中国计算数学学会第九届理事、清华大学教育指导委员(大数据项目)、浙江大学管理学院兼职教授等职。

【本书背景简介】

大数据在收集消费者全渠道行为、触发商业机遇等方面发挥了越来越重要的作用。而《决战大数据》一书恰恰洞悉了大数据时代商业发展的本质。同时,车品觉根据多年经验,通过丰富的案例和通俗易懂的语言,从“养数据”到“用数据”,深入浅出地向我们揭开了大数据化运营和运营数据的神秘面纱。通过《决战大数据》一书,车品觉告诉我们,在数据无限的时代,拥有数据化思维,才能改变商业的未来。

本书给我最大的启发:“以前,我们都是有问题找数据,而大数据时代,其最核心的特质则是[用数据找机会]”。

【本书特点】

大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

这本书,理论上看起来都很完美,但是如果不能用现实的案例来验证,这本书就是一本“别人的书”。因为书里的思想,有可能是过期的,有可能是别人编撰的,成为不了你的思想。每个人的思想都是独一无二的,哪怕是“乌合之众”的一员,同样也带有自己的情感诉求,放到陌生的环境,依然有自己处理问题的方式。该书有着作者本人独到的思想和见解,作者以自己多年的工作经验和经历,用着大家能理解的方式位我们讲述了大数据的相关知识。在学习这本书的同时,我们还要将它应用于生活的实践中,让它的优势得以施展。所以,此书十分值得去读。

本书的核心主要围绕在“如何让数据‘说话”,过去,我们最擅长的方法是根据历史数据总结规律,然后再采取行动。彼时,我们所使用的数据大多是从单一角度出发的静态数据。过去,我们使用数据的方法很简单,很少为了解决问题而提炼数据。而现在,我们更希望得到从全景出发的动态关联数据。现在更强调对数据的提炼,因为我们想要让数据产生价值,让科学的数据分析框架去解决用户的实际问题,就需要将相互关联的数据嵌入产品或生产流程汇总,在数据提炼的“最后一公里”,让数据在产品中“说话”。

第一章 大数据怎样从说到用

1.1 大数据的复杂性与真实性

大数据会夹杂着虚假信息,大数据的数据量很大,但有用的信息不一定多,甚至还会破坏核心信息。

断层才是大数据所面临的最严重的问题。现在,收集数据的人并不清楚未来使用数据的人要做什么,这是目前大数据的一大关键命门。不只是收集数据的人不知道将来的人怎么使用数据,就连创建模型的人也不知道自己所采用的数据在未来是否稳定,而使用模型的人也不知道整个数据的来路或加工过程,这些都是普遍存在且很现实的问题。

每个层级和功能部门都是一个断层,而且对数据价值的内在衡量都不一样。因此在讲到“数据价值”时,要搞清楚几个关键问题:1)要明确这是谁心中的数据价值,投资人、管理者、中层和数据分析师们心中对数据的价值自然不同;2)要明确数据的分类,不同类型的数据所产生的价值各不相同。在不断使用数据的同时,也要发现数据本身的问题——大数据需要更主动的管理,也需要更多的创新。

在大数据的商业环境里,要既懂数据,又懂商业,还要拥有一套好的思维方法,而数据化思考正式这样一个崭新的事物。

1.2 大数据的本质就是还原用户的真实需求

静态数据变成动态数据,必须要用场景来验证。数据收集的价值包含两个维度。一方面,你是否能衡量这个数据对企业产生的价值——你不会将用户的所有行为都记录下来,而是记录那些对企业自身有帮助的数据,即企业价值;另一方面,你是否能衡量这个数据对顾客的价值——这个数据如何帮助企业为客户提供更好的服务,即客户价值。从企业价值来看,数据收集实现了企业资源的合理分配。从客户价值来看,数据收集实现的是顾客体验的提升。

数据价值的确要分是从谁的角度出发的。所以,当我们谈大数据价值的时候,第一点要注意的就是角色不一样,对于数据价值的看法也就不同,所以在衡量价值时要考虑到受众和给予者这两个对立面的不同看法。在招场景与还原并行——前端还原消费者场景,后端还原业务需求。

数据的本质就是还原,这是收集元数据的关键方法。如果没有这个概念,就会不知道未来你需要什么数据,更不会知道什么是重要的数据。一旦数据多到了连自己的公司都没有办法处理的时候,那么其他会处理的人、公司和国家就会把你毫不留情地挤出市场。

1.3 的数据才是大数据“活”做数据收集

如何激活数据,让整个大数据活起来,并成为企业运营的牵引力呢?答案就是:把数据用起来。“死”数据就是单纯存储在数据库中,无法进行分析和使用,不能带来真正价值的数据。其真正价值是将数据用于形成主动收集数据的良性循环中,以带动更多的数据进入这个自循环中,并灵活运用于各个行业。

在数据的自循环中,有两个核心的关键点:一个是“活”做数据收集,另一个是“活”看数据指标。所谓“活”做数据收集,就是指企业不要局限于只收集自己用户产生的数据,还要把“别人”的数据收集过来进行综合分析;“活”看数据指标,就是指企业不要局限于已有的数据框架,而应该结合用户需求的不同场景来灵活应用收集到的“活”数据。

“活”看数据指标,动态地使用数据把数据激活,从静态数“活”用数据,就是你是否能看出这个数据本身的局限是什么。一方面,是我们的数据为用户体验改善了什么;另一方面,企业在使用数据时,对活数据的运用解决了什么问题或者开创了什么机会。

做数据收集,就是要跳出既定思维的框架,从相关联的行业和业务中去收集能够为现在所用的数据,找到能够更好地佐证企业现有业务决策和发展的数据。要牢牢记住,活用数据很重要。

1.4 无线数据,大数据的颠覆者

探索到的无线数据场景为清晰的数据分析打下了基础,从而能够更好地还原用户的行为,以便分析在多屏环境下的电子商务。面对无限数据,要解决的主要问题有两个:一是做到高效准确的手机;二是培养数据分析师的多屏思维。数据分析师多屏思维的影响,则是一个长期的过程。在无线时代和多屏时代,企业需要设计更好的技术方案来让自身更好地识别用户,用更好的产品场景让用户享受到多屏的便利,及早地培养数据使用人员的多屏思维方式,及早地规划面向无线场景的数据底层设计方案。

在未来的商业大战中,积极备战无线领域的公司,将会在移动互联网的场景下独占超越其他公司的优势,并享受更为丰厚的收益。

1.5 数据的分类与价值

数据作为一种资产,不同的数据含金量必然不同,自然就会产生不同的价值。而且,就同一组数据而言,在不同的环境下甚至会呈现出不同的价值。对于数据的认知,完全取决于我们是否拥有认知自己所拥有数据的能力,是否能够筛选出到底什么是我的核心数据,到底什么数据会被我们频繁地使用。

对于数据而言,不同的场景也会产生不同的价值,有些数据可能会变成一个运营指标,能够让管理者更好地对业务进行决策;有些数据可以对未来进行很好的预测,而不同的数据进行有机结合之后又能够对用户做出更好的商品推荐。

从数据分类的角度来看,可以将之分为以下4种。1)按照是否可以再生的标准来看,可以分为不可再生数据和可再生数据。不过千万不能因为“可再生”这个词语的存在,就对可再对不可再生的数据而言,已有的数据要严格保护,想要但是还没有的数据就要及早收集。2)按照数据所处的存储层次来看,可以分为基础层、中间层和应用层。任何管理方法,无论是集中式管理,还是分散式管理,都各有利弊,而且人和业务多了之后,企业也很难进行集中式管理。我给出的建议是,基础层必须统一,因为这是最基本的数据,而且基本数据是原始数据。除了备份的需求外没有必要在各个场合保留多份数据。只要保证这个数据有良好的元数据管理方式,就能极大地降低成本。3)各个数据主体。内容,在平台型电商可以分为交易类数据、会员类数据、日志类数据等。4)按照是否为隐私来区分,可以分为隐私数据和非隐私数据。

用傻瓜的视角去观察:事实上,换一种视角去观察,我们会避免理所当然的盲点。许多惯性思维让我们变成真正的傻瓜。像傻瓜一样去观察,用利及他人的眼光去判断,用一句话来说就是“大智若愚。先是若愚,后是大智。”现实中,把自己放在一个很低的位置去提问,这是很聪明的做法,但这对于很多人来说其实很难做到,特别是在拥有一定的地位、一定的能力后,他们更不愿意去承认“我不知道”。当我们看的长远以后,许多东西就公平了许多。同样的道理,在人生里,有大爱。学会帮助别人,你会发现,整个世界的时间仿佛都被拉长了,很多东西都变得公平了,而选择就变得容易了。

1.6 从用数据到养数据

数据应用因小而美“小”不是指数据量,而是指应用的目标很具体。把大数据做小:所有数据分析过程应该针对一些很具体的问题的,为太宽泛的目标收集数据,得到的结果要么无法满足需求方的要求,要么就对决策毫无做用。在我们面对一个问题时,首先我们应该将一个大问题划分成系列的小问题,且假设这些小问题都是可以通过获取数据来解决掉的。解决小问题时,我们需要建立起对应这个问题的”框架“。这个框架,就是解决某一小问题后能够进行决策的逻辑体系。”很多人在没有获取足够数据,并且缺乏对数据理解情况下做出决策,其实是在“享受”自己的无知”。

把数据放进“框”之中在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(场景)之中,才能看出存在的问题。

如何用框架来做决策想要解决的问题越复杂,框架也就越复杂。但是,决策最重要的前提是要从小角度切入,从“小”做起。4步走的方法:1)首先确定有什么问题,从解决问题的角度出发去收集数据。2)把收集到的数据整理好,放入一个“数据框架”内(这个框架是用来帮助决策者做决定的)3)看框架与做决策的关系。4)根据决策行动,然后检查行动是否达到目的。

被动收集数据的行为是“收集”,而主动收集数据的行为则是“养数据”。

“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策。数据养的时间越早,积累的数据也就越多。养数据同样也是一门管理和商业艺术,在养之前可能谁也不确定最终会出现什么后果,但一旦养成,则会产生非常大的商业价值。

1.7 数据的盲点,负面数据的力量

在数据中,盲点可以分为两类:一类是物理盲点,另一类是逻辑盲点。所谓物理盲点,就是指在数据库中不存在这样的数据,通常是数据收集策略出了问题。相较于物理盲点的数据遗漏情况,逻辑盲点就是有数据但是没有被很好地发掘出来。在分析数据时,相关从业者需要对数据抱有敬畏之心,不可轻易放过任何一个可能产生问题的点。数据除了物理和逻辑盲点,甚至还有一些人为制造的“盲点”。面对数据的盲点,正能量思考告诉你怎么做可以到达成功的终点,负能量思考则告诉你怎么做才不会失败。

在海量的大数据面前,我们面对的最大盲点就是,衡量应该收集多少证据才算足够,即存;如何管理仓位见过的如此多和广的数据,即管;如何使用它们实现更大的价值,即用。

第二章 阿里巴巴数据人才的培养

2.1 “混、通、晒”——阿里巴巴培养数据人才的“内三板斧”

作者在阿里巴巴任职期间,总结了一套“内三板斧”和“外三板斧”的办法,对内,用来培养数据人才,对外,实现数据应“混”。商业敏感是要靠“混”出来的,它并不会凭空出现在你面前。通过车品觉主张的“混”在一起,把部门之间的隔阂给打“通”了。团队合作也变得更加和谐高效。把数据打通,一是商业理解和数据之间的“通”,另一种就是部门数据和部门数据的交叉。知道带着业务问题来看数据或者带着数据来看业务,兼备二者的敏感,这就是做到了“通”。“混、通、晒”里最关键的连接点。

想要做到数据的沉淀和积累,想要打通数据,建立合理的系统是不二之选。

“晒”,指的是,最终的数据表现和结果,是人、商业和数据结合之后的一种“看数据”和“用数据”的方法论。在阿里巴巴,“晒”通常是通过数据来回答几个关键问题,比如:业务现在发展的好还是不好,如何利用数据帮助业务部门发现机会等等。“晒”是产生组织力量的过程,同样也适用于企业内部。数据能不能做到在获取、使用、分享、协同、连接、组合之上让自己变得超级简单和便捷,这是数据化运营里面非常重要的一点,这也正是“晒”的内容。

阿里巴巴的“混、通、晒”三板斧其实是配合了数据方法论与人的修炼,能做到借事修人,让用数据的人在数据中成长,循序渐进地让每个人都成为数据分析师。

2.2 “存、管、用”——阿里巴巴的数据应用“外三板斧”

“存”,指的是收集数据,收集起来的数据产生价值。盲目的收集不旦不会给企业创造价值,还会增加昂贵的存储和管理成本,即使像阿里巴巴这样的公司,也承担不起无限收集数据和管理数据的成本。所以,车品觉建议,企业在收集数据之前一定要有一个特定的目的。

“管”,指的是对存储数据进行保管,以确保数据的安全、准确等等。数据管理的内容包括很多方面,比如:数据的来源,如何让数据不丢失,如何保护数据的安全,如何让数据准确稳定,以及如何更好的运用数据,这些都是数据运营当中的“管”。

“用”,指的是思考“如何应用数据解决运营中存在的问题”。就拿电商的用户标签来说,阿里总共有18个用户性别标签,这些标签并不是真正意义上的生理性别,而是从用户的购物属性上定义出来的性别。比如说:夫妻俩共用一个账号,早上妻子用,晚上丈夫用,那这个账号在阿里巴巴的性别标签就是“早女晚男”。在数据应用的过程中,把本来不可以分裂的东西分裂之后再重组,就能产生新的数据价值。

第三章 大数据在未来的应用趋势

今天,我们正处于决策成本产生巨变的爆发点,过去那些想尽办法都无法获取的数据,在今天唾手可得,而当有些表面上完全不相关的行业数据关联起来时,居然产生了新的商业价值。更重要的是,过去,我们更多地是带着问题去寻找能够验证自己观点的数据,而今天我们却可以使用数据去预测可能出现的问题。海量数据可以使人的智慧得到更大的发挥,并变得更加规模化。大数据的本质是人,数据研究的极点就是莫测的人性。我们一旦掌握了数据之后的数据,就会拥有致胜未来商业的无敌利器。

作者以十几年的数据实战,对未来的数据应用有六个方向的趋势预测,分别是:应用无线化、信息数据化、交易无纸化、人类智能化、决策实时化、线下线上化。这一部分,我们来分享“信息数据化、决策实时化和人类智能化”三个方面。

3.1 信息数据化

未来会有更多的信息被数据化。由于技术限制,很多有价值的信息还不能被收集成数据,随着科技的发展,这些信息都将被数据化。比如,人脸识别技术就能让零售门店的客户信息被数据化。店员不需要再问“您需要些什么”这样的问题,就能给出相应的商品推荐。当更多有价值的信息被收集成数据,各个行业都将面临巨大的冲击。每个行业都要思考,在这一波数据红利上,如何抢占先机,管理好自己的用户数据,提升用户体验。

3.2 决策实时化

生活中我们遇到的很多问题,都是因为没有得到及时的反馈,导致我们无法作出正确决策。如果银行提前告诉你,再不还款就会收取额外利息,相信很多人都不会忘记还款了。再比如,如果糖尿病患者可以实时的了解自己的血糖水平,知道当下的这一餐会让血糖升高到多少,就能决定眼前这一餐要不要全吃光。

在未来激烈的商业竞争当中,企业影响消费者进行实时决策的能力会越来越重要。越是能够在短时间内抓住消费者,就越容易卖出产品,实现更高的顾客转化率。

3.3、人类智能化

随着可穿戴设备的出现,人和数据开始逐步融合,像谷歌眼镜这样的设备,将让我们看到的东西即时数据化;类似健康手环类设备和可以深度收集脑电波的数据设备,将随时会使我们人体的活动转化成数据。

在不远的将来,用数据记录实时记录生活将成为可能。彼时,数据将会帮助人们做出更好的判断,人类也会变得更加智能。未来,一个人的能力和聪明程度的不是由IQ决定的,而是这个人是否拥有足够的数据。人和机器的结合,或者人和数据的结合将是未来的一种进步模式,人类将通过数据变得更加智能。当下,我们要学会人机分工,让人做人最擅长的事情,让机器做机器最擅长的事情;未来,我们要相信人机结合,人机的界限已经模糊,无人驾驶汽车已经变成可能。未来人类的身上流动着的是血液以及数据。

第四章 寻找商机

如果将计算机学习比喻成人工智能的骨架与肌肉,那么大数据就是流淌在这副身体内的血液。二十年前已经有人工智能了,但直到这两年人工智能才开始爆发,为什么?那是因为以往并没有足够多的数据。如果一件事只发生了一次,你根本不可能从中提取到足够多的东西;但如果同一件事情出现了一百万次,那一百万次里所发生的种种,就会成为人工智能的一个数据源。

今天我们讲的人工智能跟以往谈论的不一样。人工智能在进步,大数据也在进步。大数据的进步又反过来推动着人工智能发展。以往不敢做、不能做的人工智能,譬如Alpha Go、人机互动、客服机器人等等,现在因为有了足够多的数据,都可以实现了。

哪些行业可以从大数据挖掘中受益?如何从海量数据里找到商业活动中最有价值的数据?本书作者车品觉认为,第一个是广告及媒体行业,因为广告和媒体自身的特殊属性和形态变化本身就需要更精准的用户数据群;第二个是金融行业,金融行业在识别一个人的征信方面就像是放款和借贷中的中转站,需要大量的用户数据;第三个是医疗行业,医疗行业应该在这几类行业当中是对人类是最有意义的。这并不是说前两者没有意义,只是医疗行业致力于让每个人更长寿、更健康,能让人活得更有意义;第四个是政府事务,政府为了提升和改善公共事务使用大数据,本质上和企业利用大数据提高利润是同一个道理。比如说在铁路修建等方面,大数据如何去赋能整个中国的经济,这一点我觉得是要爆发的,但是具体在哪个时间节点尚不清楚。

最后,本书给我最大的启示即“数据化思维”的重要性。数据化看似简单,但这背后实际上需要我们改变思维模式,即要懂得用数据改进产品/服务,懂得通过数据运营的方式来决定产品/服务创新或者生产形态创新。我们每天的工作流程中需要做很多决策,哪些决策点是可以用数据代替的?通过梳理决策点来寻找“数据嵌入”的灵感,是一个非常有效的方法。

未来是大数据的时代,未来的商业竞争就是大数据竞争。

 自我提高

选择这本书对于自己来说是不小的挑战,本书相较于一般大数据的入门级书籍,更注重于大数据的实际应用以及结构化数据思维的培养。作者结合自身经验,详细阐述了“养数据、混通晒和存管用”。养数据的观点,是我读了本书后认识的新观点。所谓养数据就是收集数据,而且是根据问题去收集数据。例如,收集数据以对比推广渠道质量;分析不同留资类型转化率;分析用户使用择居网的行为路径;分析留存情况;为后续改版提供数据支持等。

车品觉提出的“数据是有生命周期的”这个概念还是蛮有收获的,比如身高、体重在成年之前变化很快,需要注意时效性;也比如用户的购房需求在他不了解购房政策、没搞明白市场情况、没想清楚个人购房目的之前在网站上产生的浏览或搜索记录对最终的推荐也只能是参考。产品也是有生命周期的,即使有长远规划,也不应过度设计,满足阶段性需求,并留出扩展性即可。

当然,车品觉也强调“小”不是指数据量,而是指应用的目标很具体;“小”是指从小角度切入,从小做起(不要一开始设计过于复杂的框架,针对具体问题去设计,不用过度担心扩展性);总的来说,收集数据和设计产品一样,不过度设计,留出扩展余地,根据当下需求尽可能的收集更多更细的数据;评估数据收集好坏的方法:数据有没有、细不细、全不全、稳不稳、快不快。

通过这本书我们可以知道大数据究竟能带来什么价值,怎么衡量大数据创造的价值。读完此书后收获颇多,收获如下:

5.1、忽略了趋势,过去的价值一文不值

为什么经验有时会使人犯低级错误呢?应该分两种情况开看待:一种是信息不对称;另一种则是逻辑错误。当我们讨论信息不对称时,首先要讲的就是经验。经验是对过去的度量,但不是所有的经验信息的质量都很好。一般而言,数据分析师对于经验的积累上,他们对质量把控得十分严格,如对于数据信息的排序、分析可靠的信息源进行多次使用、了解信息的出处和知道信息的提供者等。这意味着,所有的信息来源都需要有正确的途径和渠道,不然,决策也会出现偏差。

除此之外,还有一个因素导致经验使人变笨,那就是在分析时忽略了趋势。如果之前的经验本身存在误差,即数据源本身就存在问题,根据经验得出的结论自然会使人犯低级错误。

5.2、做自己的个人数据管理

如何才能具有全局观的思考能力?这是我一直在思考的问题。

在本书作者车品觉看来,成功路上,有4种东西是可以积累的,分别是财富、人际关系、知识以及思维方式。前两者,大多数人都能够直接明白,而不被绝大多数人知觉的是第4点—思维方式。思维方式与你所做的选择和决策密切相关,冥冥中决定了个人“运”的走向。而在这样一个信息泛滥的环境里,很多人完全没有关注过如何积累、分类及使用当前越来越容易获得的大数据,更别说让大数据变得能为人所用。

在我们之中,绝大多数人对事物的态度只是观察,缺乏思考。而真正具有全局思维、发展眼光的做法应该是,我们要对数据做一个积累,要对自己所在行业中呈现的信息进行积累。这是一个有限时间和无限大数据进行博弈的时代。如果没有积累数据的意识,没有培养自己数据化思考的意识,改变命运真的就成为一种投机行为。


相关阅读