我有一个包含多个文本文件的.tgz
文件。我可以使用gzip
模块在Python中读取它,我看到第一行包含有关后续文件的一些信息,但我不清楚如何正确迭代Python中的文件。我希望能够做到这样的事情:
for file in tgzFile:
read file
do stuff for file
我可以读取gzip压缩文件的每一行,我可以尝试从该行的内容中识别文件的开头,但我更喜欢一种更干净的方法。感谢。
答案 0 :(得分:5)
import tarfile
tar = tarfile.open("file.tgz")
for file in tar.getmembers():
print file.name
Tar.getmembers()返回可以相应使用的TarInfo对象列表。 http://docs.python.org/2/library/tarfile.html#tarfile.TarInfo