Question

我有以下代码导致带有元组的列表。

 words \
  .map(lambda word: (word.lower(), 1))\
  .reduceByKey(lambda a, b: a + b)\
  .filter(lambda(x,y): y >= 3)

元组列表如下所示：

[(u'pardon', 6),
 (u'four', 8),
 (u'sleep', 6),
 (u'lory', 7),
 (u'pardon', 6)]

如何扩展代码，以便按长度获取字数？它应如下所示：

[(6,2),
 (7,1),
 (8,1)]

Answer 1

将_.tolower()替换为len(_)：

word.map(lambda word: (len(word), 1))