如何在Hadoop / PIG中处理非ASCII /亚洲/中文字符

时间:2013-09-24 04:52:24

标签: hadoop apache-pig

任何人都可以建议如何处理输入数据中的非ASCII /中文字符吗? 我们是否需要更改某些编码? 特别是从PIG的角度来看。

对于“wawàs”的输入值,我的猪工作正在散发:“wawï¿œs”我不明白这是什么问题。

1 个答案:

答案 0 :(得分:0)

确保首先使用UTF-8字符。