大数据:规划、实施、运维
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 初识大数据

大数据,多大算大?大数据究竟是什么?为什么要研究大数据?数字与生俱来,“大”数据早就存在,为什么今天要来谈大数据?本章将从狭义、广义、泛义和伪义四个方面来回答这些问题。

当今,移动互联网和物联网的快速发展,实现了人、机、物三元世界的高度融合。早在2011年,全球被复制和创建的数据量就达到了1.8 ZB,远超过人类有史以来所有印刷材料的数据总量。如果把1.8 ZB的数据刻录在普通的DVD光盘里,这些光盘叠加起来的高度等同于从地球到月球一个半来回的距离。这样大量的数据的意义已不仅仅是资料,而是一种战略性的资源。利用数据资源可以发掘知识、提升效益、促进创新,使其为国家治理、科学研究、技术开发和企业决策乃至个人生活服务。如今,大数据带来的信息风暴正在变革人类的生活、工作和思维,大数据成为了新一代信息技术的集中反映。

2017年年中,有两则大数据方面的新闻受到的关注度颇高。一是,5月28日,为期三天的中国国际大数据产业博览会在贵阳落下帷幕。数博会连续举办了三年,已成长为大数据领域的国际盛会,而贵州虽不是传统意义上的经济发达区域,却很好地讲述了“数据创造价值,创新驱动未来”的故事。二是,世界排名第一的20岁中国围棋手柯洁,在与谷歌人工智能系统AlphaGo的对战中三局惜败,泪洒赛场,大数据和人工智能带来的这次冲击,再次引发了新一轮的关于人机话题的热烈讨论。

随着新一轮科技革命和产业变革席卷全球,大数据、物联网、移动通信、云计算、区块链、人工智能等新技术不断涌现,数字经济正深刻地改变着人类的生产和生活方式,其作为经济增长新动能的作用日益凸显。国内的多个省市区主动顺应这一发展趋势,大胆探索,先行先试,取得了积极成效。例如广东省就在全国省级层面率先成立大数据管理局,十分重视互联网在创新发展中的先导作用,2016年4月,出台《广东省促进大数据发展行动计划(2016—2020年)》,其中明确指出,用5年左右时间,打造全国数据应用先导区和大数据创业创新集聚区,抢占数据产业发展高地,建成具有国际竞争力的国家大数据综合试验区。与此同时,这些新科技与百姓生活也越来越近,大数据无论是从概念方面还是实体方面,都在逐步渗透到人们的商业活动和日常生活中。政策的宏观引导,科技的点滴进步,最终可以让百姓的生活受益。

如果将传统的IT视为IT的1.0,那么云计算所引领的对IT资源的复用,使得用户的IT基础设施的成本大幅降低,这可以算作IT的2.0。更进一步,在基础设施不再成为障碍的前提下,大数据及数据挖掘等技术的发展用以解决数据和业务之间的结合问题,对人工智能的研究用以实现机器的自发性学习问题等,实际上已经将IT带入了3.0阶段。这正好对应了IBM倡导的三个平台,当然这种划分并不是截然的。

本章将引导读者进入大数据领域,让读者了解究竟何为大数据,树立起对大数据的客观、科学的认识。