解析子文件夹中的文件

时间:2018-08-08 18:37:51

标签: python python-3.x

我必须解析所有位于不同子文件夹中的文本文件。主文件夹是“数据”。在其中,有许多子文件夹。我必须解析这些子文件夹中的所有文件,并执行一些操作。我遇到了一个代码,但是它实际上没有用。

import glob
import os

dir="D:\\College\\Data"
file_write_in_results = open("D:\\result\\test_all_files.txt","w", encoding="utf8") # file in which we will write the desired results
subdirs = [x[0] for x in os.walk(dir)]                                                                            
for subdir in subdirs:                                                                                            
    files = next(os.walk(subdir))[2]                                                                            
    if (len(files) > 0):
        for filename in files:            
        #for filename in glob.glob('*.txt'):
            with open(filename,  encoding="utf8") as f:
                for line in f:
                    if "signed by" in line:
                         file_write_in_results.write(filename)
                         file_write_in_results.write('\n')
file_write_in_results.close() 

1 个答案:

答案 0 :(得分:1)

您不需要遍历Dirs,因为它们也将在root变量中提供,只需要files在内部循环中循环,如下所示:

import os

dir="D:\\College\\Data"
for root, dirs, files in os.walk(dir):
    for file in files:
        with open(os.path.join(root, file), encoding="utf8",mode="r") as f:
            pass
            #your file parsing logic goes here

请确保使用正确的encodingmodemode='rb'会更安全,您也可以将它们全部包装在try except中,以处理有问题的文件,这样,如果遇到此类文件,解析过程就不会停止。