我创建了一个带有管道分隔符的外部配置单元表。我的所有列都是Strings类型。文件中的一个值是一段文本。我无法理解的是Hive终止此文本并在没有管道时将其放在下一列中的原因。该段落中有许多连续的空格。当Hive尝试读取文件时,这可能是一个问题。示例文本是:
'...SATA Hooper Size \= 6000...'.
Hive将部分放在columnA中的SATA和columnB中的下一部分。当空白太长时,我认为它重复了这一点。任何线索,为什么它这样做以及如何解决这个问题?是不是有很多连续的空格,Hive认为字符串已经结束了?
答案 0 :(得分:1)
我曾经因为看不见的角色而遇到类似的问题。
1.将数据下载到本地。
2.你应该有管道分隔符,或者你有一个新的行符号。
确认,在VI中打开文件并检查(不可见)字符。