大数据采集、预处理与可视化(微课版)
上QQ阅读APP看书,第一时间看更新

1.4 大数据思维

数据思维,是指在利用数据解决业务问题的过程中所表现出来的思维模式。大数据时代,数据就是金矿,而思维方式则是打开金矿大门的钥匙。大数据思维的核心有两个:一是数据敏感度,即看到一个业务问题时是否可以将它转化为数据问题;二是数据方法经验,即利用数据建模和数据分析的方法来解决实际问题。所以,大数据的发展,不仅取决于数据资源的扩展,还取决于大数据技术的应用,更取决于大数据思维的形成。只有具有大数据思维,才能够更好地运用大数据资源和大数据技术。

1.4.1 传统思维方式

1.中国的传统思维方式

中国的传统思维方式中,最典型的包括整体思维、直观思维、类比思维和辩证思维。

(1)整体思维

整体思维,是指把天、地、人、社会看作密切贯通的一个整体,认为天、地、人、社会都处在一个整体系统中,各系统要素之间存在着互相依存的联系。无论是先秦的儒家还是道家,都是把人与天地万物看作一个整体系统的。例如,庄子说“天地与我并生,而万物与我为一。”

(2)直观思维

直观思维,是指在以往经验知识积累的基础上,迅速地把握事物本质,以及基于这种能力而产生的思维方式。儒家、道家都主张以直观为基础去领悟、把握宇宙和人生。例如,朱熹说“众物之表里精粗无不到,而吾心之全体大用无不明矣。”

(3)类比思维

类比思维是根据两个具有相同或相似特征的事物间的对比,从某一事物的某些已知特征出发推测另一事物也存在相应特征的思维活动。例如,《庄子·齐物论》中,通过“狙公赋芧”“罔两问景”“庄周梦蝶”等比喻,来论证对任何事物的认识本无确定不变的是非标准。

(4)辩证思维

辩证思维,就是运用对立统一的观点、方法来认识、分析各种自然现象及其变化的思维方式。辩证思维是唯物辩证法在思维中的运用,唯物辩证法的范畴、观点、规律完全适用于辩证思维。我国的辩证思维起源较早,老子讲“正言若反”,就是说一句话看起来是反面的,其实有深刻的含义。

2.西方的传统思维方式

西方的传统思维方式与我国的传统思维方式最大的不同在于逻辑思维和机械思维等方式。

(1)逻辑思维

逻辑思维,指人们在认识事物的过程中借助于概念、判断、推理等思维形式能动地反映客观现实的理性认识过程,又称抽象思维。它是作为对认识者的思维及其结构以及起作用的规律的分析而产生和发展起来的。社会实践是逻辑思维形成和发展的基础。

(2)机械思维

机械思维的核心思想可以概括为如下3点:一是世界变化的规律是确定的;二是这些规律可以用简单的公式或语言描述清楚;三是这些规律是普遍适用的。机械思维的特点就是必然性和确定性,讲究因果关系。

综合来看,中国人偏好形象思维,西方人偏好抽象思维或逻辑思维;中国人偏好综合思维,西方人偏好分析思维;中国人偏好求同思维,西方人偏好求异思维。由于各民族的社会实践、文化和地理条件的不同,中西方的思维方式不尽相同并各具特色。而思维方式本身没有好坏之分,只是不同的场合和时期某种思维方式更能产生积极的作用,更能有利于问题的解决。因此,我们在处理一切事物的过程中,在思维方式上要中西方相互借鉴,取长补短,从而有利于问题的解决,更好地促进社会政治和经济的发展。

1.4.2 大数据思维方式

大数据已成为不可或缺的重要资源,必须在传统思维方式的基础上,树立基于大数据的思维理念,用以数据为核心的思维方式思考问题和解决问题。让数据说话,听数据指挥。

1.数据价值原理

大数据时代让数据变得在线,并且从以前的以“功能”为价值转变为现在的以“数据”为价值。大数据的关键并不在于“大”,而在于“有用”,价值含量和挖掘成本比数据量更为重要。通过利用有价值的数据,能够让企业更好地了解客户需求、消费倾向、喜好等,并据此提供个性化服务。不管大数据的核心价值是不是通过预测来实现的,但是基于大数据形成决策的模式已经为不少企业带来了盈利和良好的声誉。

2.全数据样本原理

以前,由于记录、存储和分析数据的工具有限,准确分析大量数据成为一种挑战。为了让数据分析变得简单,人们通常采用抽样调查的方法,把数据量缩减到最少。而在大数据时代,人们已经逐渐开始利用所有的数据,而不再是仅依靠一小部分数据。全数据样本调查相比传统的抽样调查而言,结果将更具真实性和可靠性,足够多的数据可以让人们透过现象看本质,从而洞察事物的内在规律。所采集的数据量越大,越能更真实地反映事物的特性。

3.关注效率原理

企业可通过分析大数据让决策更为科学,并且还应该由关注精确度转变为关注效率。大数据之所以能提高生产及销售效率,是因为通过大数据可以让企业决策者准确掌握市场及消费者的需求。只要大数据分析指出某件事物的可能性,企业便可根据相关结果快速决策、迅速动作、抢占先机,从而提高工作效率。

4.数据驱动的方法

从自然科学的角度来看,人类通常用数学公式的方法描述自然规律。将规律用一个数学公式表达,数学公式就是模型(Model)或者叫作模式(Pattern)。但是,当我们对一个问题暂时不能用简单而准确的方法解决时,可以根据以往的历史数据,构造出近似的模型来逼近真实情况,这就是数据驱动的方法。使用数据驱动的方法得到的模型虽然和真实情况有偏差,但是足以指导实践,并且数据驱动的方法能够最大程度地助益计算机技术的进步和数据量的增加。