前段时间据相关媒体报道,清华附小六年级学生一篇题为《大数据帮你进一步认识苏轼》的小论文,被冠以大数据之名,一时间抄的沸沸扬扬。其实,这篇文章是“小数据”,是用量化的方式呈现了“数据化”的苏东坡。
这只是“炒作大数据”的一个缩影。这几年科技大咖们孜孜不倦地布道,大数据现在几乎成了全球先进生产力的标志,而且几乎被赋予万能的希望。但是事实上呢,全球拥有真正意义上大数据的公司并不多,而拥有分析大数据能力的公司更是凤毛麟角。而大数据的稀缺和分析的高难度,也就注定了进入其的高门槛。
大数据的分析是很复杂的,哈佛大学、美国东北大学的几位学者认为,因为大数据的收集过程,很难保证像传统小数据那样缜密,难免会出现失准的情况。最核心的问题是,大数据分析侧重相关性,导致在推导因果关系时容易出现误差。所以,他们主张,把大数据与小数据相结合,以“全数据”思维取代“大数据”思维。
现在正在从事或者打算从事“大数据分析”的各位?对于大数据的理解是怎样的呢