如何检查HDFS文件是否包含二进制数据?

时间:2017-05-10 13:18:16

标签: file hadoop hdfs

是否有任何工具或实用程序可以检查HDFS文件是textfile还是二进制文件,如avroORC等?

我无法回复文件扩展名。我不想知道确切的类型。我只需要知道数据是否可读

1 个答案:

答案 0 :(得分:3)

让我们bash

 hdfs dfs -cat /file/on/hdfs | head -15 > tmp ; file -i tmp ; rm tmp

对于parquet等不可读的文件,你会得到这个:

tmp: application/octet-stream; charset=binary