2017大数据采用率达到高峰,近一半的公司采用大数据分析

从互联网券商的行业视角了解到,对所有受访企业而言,2017年的大数据采用率为53%,高于2015年的17%,而电信和金融服务行业则引领了这一趋势。报告、仪表板、高级可视化终端用户“自助服务”和数据仓库是商业智能的新应用技术和趋势。数据仓库优化仍然是大数据的主要用例,其次是客户/社会分析和预测维护。在大数据分布中,cloudera是最受欢迎的,其次是hortonworks、map / r和amazon emr。
这些和其他许多见解来自dresner咨询服务的2017年大数据分析市场研究,这是他们智慧的一部分的研究。这第三个年度报告分析了围绕大数据分析的最终用户趋势和意图,定义为使最终用户能够访问和分析hadoop生态系统中包含和管理的数据的系统。2017年的大数据分析市场研究代表了跨地域、功能、组织规模和垂直行业的数据的交叉部分。
“在我们全面研究大数据分析的三年时间里,我们看到使用量大幅增加,而那些没有计划采纳的人数大幅下降,”德累斯顿咨询服务公司(dresner advisory services)创始人兼首席研究官霍华德德累斯顿(howard dresner)表示。在2017年,它已经成为最典型的大数据采用者,尽管所有部门——包括金融部门——都在考虑未来的使用。这表明,大数据正在变得不那么具有实验性,而更多的是在组织内部进行实际的追求。
北美的大数据分析以emea(53%)的使用率领先于其他地区。亚太地区的受访者表示,目前有44%的受访者表示他们“将来可能会使用大数据”。spark、mapreduce和纱线是当今最流行的三个软件框架。超过30%的受访者认为spark对他们的大数据分析策略至关重要。对超过20%的受访者来说,mapreduce和纱线是“至关重要的”。受调查者最喜欢的大数据访问方法包括spark sql、hive、hdfs和amazon s3。73%的受访者认为spark sql对他们的分析策略至关重要。超过30%的受访者认为hive和hdfs也很重要。amazon s3对于管理大数据访问的五个应答者之一是至关重要的。
从互联网券商的行业视角了解到,机器学习继续获得更多的行业支持,而spark machine learning library(mlib)的投资计划预计在未来12个月内增长60%。在接下来的24个月里,mlib将根据调查结果支配机器学习。mlib可以从sparklyr程序包和其他许多程序中访问,这将继续推动它的增长。