Hadoop案例笔记2
Hadoop案例笔记2 内容接上一个笔记 Hadoop案例笔记1 我们对题目进行一个扩展,在上一个案例得出的结果上将统计的结果按照总流量的倒序排序
学习到spark的RDD行动操作时,有一个函数可让我废了半天脑筋,就是aggregate函数,aggregate的意思是聚合
我们首先来看一下spark官方文档对这一函数的说明:
先前使用idea进行远程提交spark程序采用的是local,也就相当于单机版spark,于是乎我又试了一下spark自带的standalone模式。但是在setMaster(“spark://192.168.160.30:7077”)的时候出现了问题