Hadoop Mapper读取键值对

时间:2014-09-05 14:14:53

标签: hadoop mapreduce

是否有内置的输入格式,我可以在mapper函数中使用以读取以下格式的输入行:

Name [key1#val1,key2#val2,key3#val3,key4#val4]

示例输入数据可能如下所示:

sanjose [population#123,area#123,address#1,jkui,ty,tz#PST]
delhi [population#1823,area#1023,address#1,jkui,ty,tz#IST]
boston [population#1823,area#1023,address#1,jkui,ty,tz#EST]

1 个答案:

答案 0 :(得分:0)

设置属性mapreduce.input.keyvaluelinerecordreader.key.value.separator并使用job.setInputFormatClass(KeyValueTextInputFormat.class);

在您的情况下,我相信\t是键值定界符