为什么要在Hadoop中将返回值定义为函数参数?

时间:2017-09-29 13:15:01

标签: java hadoop

目前我正在浏览关于Keywords班级的Hadoop documentation

在签名(是正确的命名法吗?)中,我们必须指明我们投入的内容,以及出现的内容:

Mapper

这是否意味着我们需要在我们称之为的地方之外定义和实例化这些数据结构?

1 个答案:

答案 0 :(得分:1)

您需要定义特定MapReduce任务的InputFormat和OutputFormat,是的。但它不是返回值,而是写入Context输出的内容。

这是通过Job类配置的。

您所称的“签名”与Java泛型的任何其他应用程序没有什么不同。

对于默认的TextInputFormat + LineRecordReader,它们对这些参数使用LongWritable和Text。

如果这是您的问题,Hadoop库已经定义了其他格式和Writable。

欢迎您定义自己的,但