EMR作业中的自定义RecordReader

时间:2012-05-24 02:24:37

标签: hadoop amazon-web-services emr

如何在Amazon EMR上指定要在作业流程中使用的自定义RecordReader

注意: Hadoop新手在这里。

1 个答案:

答案 0 :(得分:1)

您可以在驱动程序类中指定输入格式(类别包含在作业的“main”中。记录阅读器是您输入格式的逻辑部分,实际上将其返回到映射任务。
我不认为它是EMR特有的东西。