如何在Hadoop流中指定unprintable作为键值分隔符

时间:2012-06-27 14:15:44

标签: java hadoop hadoop-streaming

ATT。我使用stream.map.output.field.separator =来指定分隔符

1 个答案:

答案 0 :(得分:1)

我不确定你是否可以通过-Dkey = value generic options语法传入一个不可打印的字符,但你应该能够修改代码以允许对类似转义的代码进行特殊解释:

修改此代码,您可以检测到类似&#x的前缀,并将尾随字符视为十六进制编码,因此标签可以作为-Dstream.map.output.field.separator=&#x09传递。