按照业界权威高德纳咨询公司的定义:“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。”
根据百度百科词条的定义:“大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助企业经营决策更积极目的的资讯。”
“大数据”到底有多大?目前通行说法,“大数据”至少要达到PB 量级。其中,1PB=22.3 万张DVD 光盘的容量,相当于800 个人类大脑记忆总量,或90 个人身体细胞数目总和。1PB 的mp3 歌曲可以连续播放2000 年。
美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90% 以上的数据是最近几年才产生的。全世界的工业设备、汽车、电表等设备上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生着海量的数据信息。