Hive错误地读取文件

时间:2013-08-01 01:20:16

标签: hive

我创建了一个带有管道分隔符的外部配置单元表。我的所有列都是Strings类型。文件中的一个值是一段文本。我无法理解的是Hive终止此文本并在没有管道时将其放在下一列中的原因。该段落中有许多连续的空格。当Hive尝试读取文件时,这可能是一个问题。示例文本是:

'...SATA            Hooper Size  \= 6000...'.  

Hive将部分放在columnA中的SATA和columnB中的下一部分。当空白太长时,我认为它重复了这一点。任何线索,为什么它这样做以及如何解决这个问题?是不是有很多连续的空格,Hive认为字符串已经结束了?

1 个答案:

答案 0 :(得分:1)

我曾经因为看不见的角色而遇到类似的问题。

1.将数据下载到本地。

2.你应该有管道分隔符,或者你有一个新的行符号。

确认,在VI中打开文件并检查(不可见)字符。