Hadoop - 搜索特定字符串然后返回包含字符串的文件名

时间:2016-04-23 11:40:24

标签: hadoop hdfs

在hadoop hdfs中,如何编写一个命令,列出包含字符串'SFD'的所有文件

要搜索字符串,这里是命令,我可以得到结果,但我想知道哪些文件包含这个字符串'SFD',而且我在测试目录中有一千个文件。

hadoop fs -cat /test/*.txt | grep SFD

1 个答案:

答案 0 :(得分:2)

试试这个:

hadoop fs -ls /test/*.txt | awk '{print $8}' | while read f; do hadoop fs -cat $f | grep SFD && echo $f ; done