蜂巢长度输出超过看到

时间:2015-02-18 14:47:06

标签: hadoop hive

我正在尝试运行一个hive查询,它应该连接两个匹配记录的表。但是,它从不匹配,但我在另一个表中有记录。当我做一个给定字符串的长度时,它输出27,但它应该只有12。 当我从s3下载输出文件时,我看到奇怪的行像

  

U S 3 F F 1 2 1 4 9 3 3

但是在hive控制台中它将其视为

  

US3FF1214933

我也无法使用

查询行

select * from table where item like "US3FF1214933";

现在完全是一团糟,修剪对我来说也不起作用。 我需要帮助。

提前致谢,

1 个答案:

答案 0 :(得分:0)

感谢legato给我一个想法,通过这样做来调查 od -c并查看字符串之间的实际字符。

在hive查询中使用regexp_replace(ExString,' \ 0',"")用空字符串替换奇怪的字符解决了我的问题。