在textfile
格式中,数据以文本格式存储,其字段由字段分隔符分隔。这就是为什么我们更喜欢不可读的分隔符,如 CTRL ^ A 。
但是在rcfile
,orc
,avro
&创建配置单元表时使用字段分隔符是否有任何影响? sequencefile
。
在一些hive教程中,我也看到了这些二进制文件格式中分隔符的使用。
示例:
create table olympic_orcfile(athelete STRING,age INT,country STRING,year STRING,closing STRING,sport STRING,gold INT,silver INT,bronze INT,total INT) row format delimited fields terminated by '\t' stored as orcfile;
Hive中的字段分隔符是否被忽略或者二进制文件格式是否重要?
答案 0 :(得分:0)
被RCFILE,ORC和AVRO忽略,但对SEQUENCEFILE很重要。