Python文件-IO和zipfile。尝试遍历文件夹中的所有文件,然后使用Python循环遍历各个文件中的文本

时间:2015-04-02 16:54:51

标签: python python-3.x file-io nested-loops zipfile

尝试提取所有zip文件,并为所有文件所在的文件夹指定相同名称。 循环遍历文件夹中的所有文件,然后循环遍历这些文件中的行以写入不同的文本文件 到目前为止,这是我的代码:

#!usr/bin/env python3
import glob
import os
import zipfile

zip_files = glob.glob('*.zip')
for zip_filename in zip_files:
    dir_name = os.path.splitext(zip_filename)[0]
    os.mkdir(dir_name)
    zip_handler = zipfile.ZipFile(zip_filename, "r")
    zip_handler.extractall(dir_name)

path = dir_name
fOut = open("Output.txt", "w")

for filename in os.listdir(path):
    for line in filename.read().splitlines():
        print(line)
        fOut.write(line + "\n")
fOut.close()

这是我遇到的错误:

for line in filename.read().splitlines():
AttributeError: 'str' object has no attribute 'read'

1 个答案:

答案 0 :(得分:1)

你需要打开文件并加入文件的路径,也使用分割线,然后在每一行添加换行有点多余:

path = dir_name
with open("Output.txt", "w") as fOut:    
    for filename in os.listdir(path):
        # join filename to path to avoid file not being found
        with open(os.path.join(path, filename)):
            for line in filename:
                fOut.write(line)

您应始终使用with打开文件,因为它会自动关闭它们。如果文件不大,您只需fOut.write(f.read())并删除循环。

您还设置了path = dir_name,这意味着路径将被设置为第一个循环中dir_name的最后一个值,这可能是您想要的,也可能不是。您还可以使用iglob来避免创建完整列表zip_files = glob.iglob('*.zip')