在信息化时代,一切都是数据,数据就是一切。人类每天都在产生数据,以目前互联网所构成的信息世界为例子来进行描述。
在2005年,谷歌CEO埃里克·施密特估算互联网包含5*109GB数据。另所IDC International Data Corporation报告,全球2007年产生的数据量为281*109GB;到2008年底,全球数据内容的问题激增为487*109GB。作为对比,美国国会图书馆的存书大致相当于2*104GB;而《四库全书》,包含79337卷,36000余册,汉字约8亿字,全文本大约1.6GB。
数据构成了这个世界,数据的产生来自于这个世界,对数据进行正确的分析可以让我们更加了解这个世界。目前很多互联网公司都在进行收据分析和数据挖掘,目的就是为了从用户不经意的网络足迹来对用户习惯或者社会行业趋势进行分析等等,用户的习惯和社会行业趋势对于企业或者国家进行重大决策具有重要的参考价值,产生的商业价值和社会价值自然不言而喻。
阅读全文