用于空字段的Hadoop FileFormat

时间:2014-04-19 12:24:59

标签: csv hadoop binary hbase avro

我在考虑以HDFS中提供的任何格式存储在CSV文件下面。

        H1  H2  H3  H4     

Row1    1   NA  8.6 65
Row2    2   NA  NA  56
Row3    4.6 7.5 NA  65

我知道很容易,我们可以通过跳过特定行的限定符来轻松地在Hbase中呈现这一点。我正在寻找这样的任何文件格式,这样我们就可以跳过在文件中保存NA并在其他地方指向这个(元数据)而不是保留NA。

0 个答案:

没有答案