我必须解析所有位于不同子文件夹中的文本文件。主文件夹是“数据”。在其中,有许多子文件夹。我必须解析这些子文件夹中的所有文件,并执行一些操作。我遇到了一个代码,但是它实际上没有用。
import glob
import os
dir="D:\\College\\Data"
file_write_in_results = open("D:\\result\\test_all_files.txt","w", encoding="utf8") # file in which we will write the desired results
subdirs = [x[0] for x in os.walk(dir)]
for subdir in subdirs:
files = next(os.walk(subdir))[2]
if (len(files) > 0):
for filename in files:
#for filename in glob.glob('*.txt'):
with open(filename, encoding="utf8") as f:
for line in f:
if "signed by" in line:
file_write_in_results.write(filename)
file_write_in_results.write('\n')
file_write_in_results.close()
答案 0 :(得分:1)
您不需要遍历Dirs,因为它们也将在root
变量中提供,只需要files
在内部循环中循环,如下所示:
import os
dir="D:\\College\\Data"
for root, dirs, files in os.walk(dir):
for file in files:
with open(os.path.join(root, file), encoding="utf8",mode="r") as f:
pass
#your file parsing logic goes here
请确保使用正确的encoding
和mode
。 mode='rb'
会更安全,您也可以将它们全部包装在try except
中,以处理有问题的文件,这样,如果遇到此类文件,解析过程就不会停止。