最近有不少初学者来问到,学习大数据,学习spark公司主要使用那些语言编写,每听到这一个问题,起码还是很不错的,证明你已经开始学习大数据了,并了解大数据spark是可以使用多种语言来实现开发的,那就是java、scala、python和r语言都可以使用,那简单分析一下:
首先java,是现阶段使用较为居多,为什么呢?是由于玩java转到大数据人数太多人的缘故,所以很多人都喜欢使用java,也有的是由于公司为了维护和人才的使用考虑,会选择使用java语言开发,也有的是因为平台会有hadoop的mapreduce老程序与spark任务混合使用,为了平台统一开发语言而选择java,也有的公司为了对接外面项目而选择通用性比较强的java语言开发。
scala,也可以是说大数据spark开发的主力语言了,因为当你学习spark后,就一定会对scala有进一步的研究与学习,因为为了学好spark技术你需要研究源码、需要更简洁快速开发项目。从而spark大数据开发语言scala是最多。
python,在机器学习、ai的崛起,也有很多人青睐的语言了;还有一波人喜欢,那就是大数据分析人员,在sql与spark sql 使用python来进行脚本调度。
r,这个现在小编也是用不到,就不多说了,有了解大神可以给补充,留言评论,感谢!
本篇分析只是过人体验,如有任何不妥,欢迎留言修正,感谢感谢!
欢迎关注,获取更多资料