标签: csv hadoop binary hbase avro
我在考虑以HDFS中提供的任何格式存储在CSV文件下面。
H1 H2 H3 H4 Row1 1 NA 8.6 65 Row2 2 NA NA 56 Row3 4.6 7.5 NA 65
我知道很容易,我们可以通过跳过特定行的限定符来轻松地在Hbase中呈现这一点。我正在寻找这样的任何文件格式,这样我们就可以跳过在文件中保存NA并在其他地方指向这个(元数据)而不是保留NA。