将列表分成字符串而不是字符

时间:2013-09-02 23:27:10

标签: python list hadoop

我的defaultdict看起来像这样:

"Some text" : ["Some date", "Some date", "Some Date"]

我试图访问每个键的每个值,如下所示:

for processedTweet, date in tweetsDict.iteritems():
    print date
    for d in date:
        print d

这在普通的Python脚本中运行良好。它首先打印整个列表,然后在for循环中打印每个日期。

但是,当我将此作为Map / Reduce作业的一部分发送给Hadoop时,它会将列表分成单个字符,而不是字符串,即:

Some date

变为

S
o
m

等。为什么会发生这种情况?我该如何解决?

1 个答案:

答案 0 :(得分:0)

hadoop中的map / reduce作业将列表值分配给for循环,而不是传递整个列表。默认情况下,当python迭代字符串对象时,每次迭代都会返回字符串中的下一个字符。