在Spark中将多个字符串映射到一个键

时间:2019-01-04 14:57:03

标签: python apache-spark

我有一个看起来像这样的文本文件:

1825:lots of words
1899:a few more words
2018:other words

现在,我想创建一个像哈希图这样的东西,最后我将输出频率最高的1、2等单词。是否可以将相同的键用于不同的值?

我很难理解lambda行和reduceByKey。

谢谢

0 个答案:

没有答案