标签: hadoop amazon-web-services emr
如何在Amazon EMR上指定要在作业流程中使用的自定义RecordReader?
RecordReader
注意: Hadoop新手在这里。
答案 0 :(得分:1)
您可以在驱动程序类中指定输入格式(类别包含在作业的“main”中。记录阅读器是您输入格式的逻辑部分,实际上将其返回到映射任务。 我不认为它是EMR特有的东西。