标签: python apache-spark
我有一个看起来像这样的文本文件:
1825:lots of words 1899:a few more words 2018:other words
现在,我想创建一个像哈希图这样的东西,最后我将输出频率最高的1、2等单词。是否可以将相同的键用于不同的值?
我很难理解lambda行和reduceByKey。
谢谢