应用错误收集

在Spark中将多个字符串映射到一个键

时间：2019-01-04 14:57:03

标签： python apache-spark

我有一个看起来像这样的文本文件：

1825:lots of words
1899:a few more words
2018:other words

现在，我想创建一个像哈希图这样的东西，最后我将输出频率最高的1、2等单词。是否可以将相同的键用于不同的值？

我很难理解lambda行和reduceByKey。

谢谢

0 个答案:

没有答案