在python hdfs中,有没有办法在list方法中使用通配符或正则表达式?

时间:2019-11-07 08:32:07

标签: python regex wildcard python-hdfs

在linux hadoop fs -ls 中,我可以使用通配符(/ sandbox / *),但是pyhon hdfs客户端列表方法对此失败,因为它是未知路径。在python-hdfs中使用通配符还有其他方法吗?

1 个答案:

答案 0 :(得分:0)

找到了this,它在fnmatch中使用os.walk,并将其用于hadoop_client。

以下是查找csv文件的示例:

for root, dirs, files in hc.walk(Path):
    for filename in fnmatch.filter(files, '*.csv'):
        print(os.path.join(root, filename))