python ngram reducer没有返回任何输出?

时间:2014-12-19 10:28:54

标签: python-2.7 ubuntu mapreduce

我正在尝试为nogle的Google图书构建mapreduce工作。我的mapper在本地测试时工作正常,但reducer不返回任何值。减速器如下所示:

#! /usr/bin/env python

import sys

current_word = ''
word_in_progress = ''
target_year_count = 0   
prior_year_count = 0
target_year = 1999

for line in sys.stdin:
    line = line.strip().split('\t')
    if len(line) !=3:
        continue
    current_word, year, occurances = line

    if current_word != word_in_progress:
        if target_year_count > 0:
            if prior_year_count ==0:
                print '%s\t%s' % (word_in_progress, target_year_count)
    try:
        year = int(year)
    except ValueError:
        continue
    try:
        occurances = int(occurances)
    except ValueError:
        continue

    if year == target_year:
        target_year_count += occurances
    if year < target_year:
        prior_year_count += occurances
            print '%s\t%s' % (word_in_progress, target_year_count)
if target_year_count > 0:
    if prior_year_count ==0:
        print '%s\t%s' % (word_in_progress, target_year_count)

当我在Ubuntu命令行中输入以下命令时:

hduser@bharti-desktop:~/hadoop$ cat /home/hduser/Documents/test1.1.txt | /home/hduser /hadoop/mapper-ngram.py | sort -k1,1 | /home/hduser/hadoop/reducerngram1.py| sort -k2,2n

我一无所获。有人能告诉我我做错了什么。

1 个答案:

答案 0 :(得分:0)

首先我要检查:

cat /home/hduser/Documents/test1.1.txt | /home/hduser /hadoop/mapper-ngram.py | sort -k1,1 | /home/hduser/hadoop/reducerngram1.py| sort -k2,2n
                                                     ^ # Is this space a typo?

这个空间是你帖子中的拼写错误,还是你真的以这种方式运行命令?如果这是您的命令的准确表示,我猜测输入实际上没有到达您的映射器(因此没有任何东西可以到达您的缩减器)。