需要帮助有关javardd中的字母数

时间:2019-06-19 10:56:06

标签: java apache-spark bigdata

我必须像Java Wordcount一样使用JavaRDD在Java Spark中创建一个字母计数程序。但是我不知道将如何使用分割条件来分隔/计算段落中每个字母的出现。请在Java Spark示例中帮助我,谢谢。我的javawordcount的工作代码如下所示。

 JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split(" ")));

        JavaPairRDD countData = wordsFromFile.mapToPair(t -> new Tuple2(t, 1)).reduceByKey((x, y) -> (int) x + (int) y);

//The above condition is used for word count

1 个答案:

答案 0 :(得分:0)

对于字符计数,我们可以使用content.split(“”)

 JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split("")));

它将提供内容中出现的每个字符的计数。如果只希望字母(字母)使用过滤器。