我有一个外部Hive表,里面填充了一个txt文件夹。那里有一些特殊字符,如ô,é,à,€,......当我用Hive查询这个表时,这些字符显示为带有白色问号的黑色方块。
但是,我还使用包含这些字符的sqoop从mysql导入了一个Hive表。当我查询这个表时,字符会以正常方式显示。
当我从hdfs中捕获文件时,字符也会以它们应该在终端中的方式显示。我是否必须以特定方式为不工作的Hive表设置字符编码?如果是这样,怎么样?
答案 0 :(得分:0)
在将文件放入HDFS之前,我使用iconv将它们从windows-1252编码转换为utf-8解决了这个问题。