Question

我有一个包含以下格式的数据的文件：导演电影

我正在使用hadoop和Java来处理它。

计算每位导演的电影数量是非常基本的，但我如何修改代码来获得这样的内容：

导演movie1 movie2 movie3 ...

Answer 1

我认为从计算每个导演的电影数量可以直截了当，高级结构可能是这样的：

mapper(file):
    for each (director, movie) in file:
        emit(director, movie)

reducer(director, movies):
    movielist = []
    for each movie in movies:
        movielist.add(movie)
    emit(director, movielist)

Answer 2

这样做。

@Override
    public void reduce(Text key, Iterable<Text> values, Context context)
            throws IOException, InterruptedException {

        String movies;

        for (Text value : values) {
            movies += value.toString() + " ";
        }
        context.write(key, new Text(movies));
    }

如何将Hadoop输出转换为Text，Text格式？

2 个答案: