在linux hadoop fs -ls 中,我可以使用通配符(/ sandbox / *),但是pyhon hdfs客户端列表方法对此失败,因为它是未知路径。在python-hdfs中使用通配符还有其他方法吗?
答案 0 :(得分:0)
找到了this,它在fnmatch中使用os.walk,并将其用于hadoop_client。
以下是查找csv文件的示例:
for root, dirs, files in hc.walk(Path):
for filename in fnmatch.filter(files, '*.csv'):
print(os.path.join(root, filename))