零基础入门Spark groupBy操作(Java版)

按照元素的字符串长度进行分组,groupBy的参数就是自定义分组规则的函数,把函数返回值相同的元素分在一组,最后生成新的key,value形式的JavaPairRDD,key 就是分组名也就是字符串长度,value就是该组的所有元素集合。

网站地图