大数据的核心:预测

数据化意味着我们要从一切太阳底下的实物中汲取信息,甚至包括很多让我们以前认为和“信息”根本搭不上边的事情。
大数据的核心就是预测。随着大数据的发展,我相信在不远的未来,现在很多单纯依靠人类判断力的领域都会被计算机系统改变甚至取代。整个世界都能被数据化,所有的一切都可以用数据记录和考量。正如舍恩伯格所说,我们的数据和信息来源于太阳底下的一切。
不像过去一样,我们对于我们所要了解的事实只能通过有限数据的随机抽样来分析,最终得到一个具有概率性的结论。在大数据时代,对于我们想要了解的特定现象,在特定的领域中我们可以用全体数据去代替随机样本,通过数理模型的分析,将所有的小概率事件都被纳入结果之中,更为精确、更为有效的得到我们想要的结果。从过去中发现事物发展的规律,在过去和将来之间寻找出关联物,通过模型处理和数据分析,我们就能做到它——预测未来。
或许听起来匪夷所思,但确实有理有据。正如前面所说,谷歌通过网络上的搜索记录,可以预测流感爆发的时间和区域;farecast通过旅游网站的数据可以分析特定航线上未来机票价格的涨跌。这让我觉得大数据充满着无限的可能,而这仅仅是一个简单的开始,它的魅力远不止如此。每年如此,让我热血沸腾。
大数据的科学价值和社会价值正是体现在这里。一方面,对大数据的掌握程度可以直接转化经济价值的来源。另一方面,大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。而这一切,都将会是我们的未来。