我必须像Java Wordcount一样使用JavaRDD在Java Spark中创建一个字母计数程序。但是我不知道将如何使用分割条件来分隔/计算段落中每个字母的出现。请在Java Spark示例中帮助我,谢谢。我的javawordcount的工作代码如下所示。
JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split(" ")));
JavaPairRDD countData = wordsFromFile.mapToPair(t -> new Tuple2(t, 1)).reduceByKey((x, y) -> (int) x + (int) y);
//The above condition is used for word count
答案 0 :(得分:0)
对于字符计数,我们可以使用content.split(“”)
JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split("")));
它将提供内容中出现的每个字符的计数。如果只希望字母(字母)使用过滤器。