字段分隔符在Hive中是否以二进制文件格式存在?

时间:2017-05-28 06:44:25

标签: hadoop hive

textfile格式中,数据以文本格式存储,其字段由字段分隔符分隔。这就是为什么我们更喜欢不可读的分隔符,如 CTRL ^ A

但是在rcfileorcavro&创建配置单元表时使用字段分隔符是否有任何影响? sequencefile

在一些hive教程中,我也看到了这些二进制文件格式中分隔符的使用。

示例:

create table olympic_orcfile(athelete STRING,age INT,country STRING,year STRING,closing STRING,sport STRING,gold INT,silver INT,bronze INT,total INT) row format delimited fields terminated by '\t' stored as orcfile;

Hive中的字段分隔符是否被忽略或者二进制文件格式是否重要?

1 个答案:

答案 0 :(得分:0)

被RCFILE,ORC和AVRO忽略,但对SEQUENCEFILE很重要。