我已经下载了一组html文件并将我保存的文件路径保存到.txt文件中。它在新行上有每条路径。我想查看列表中的第一个文件,然后遍历整个列表,打开文件并提取数据,然后再转到下一个文件。
我的代码可以直接放入(对于第一个文件)的单个路径,因为:
path = r'C:\path\to\file.html'
并且如果我使用:
遍历文本文件,则有效file_list_fp = r'C:\path\to\file_with_pathlist.txt'
with open(file_list_fp, 'r') as file_list:
for filepath in file_list:
pathend = filepath.find('\n')
path = file[:pathend]
q = open(path, 'r').read()
但是当我尝试使用以下任一路径获取单个路径时失败:
with open(file_list_fp, 'r') as file_list:
path_n = file_list.readline()
end = path_n.find('\n')
path_bad1 = path_n[:end]
或:
with open(file_list_fp, 'r') as file_list:
path_bad2 = file_list.readline().split('\n')[0]
使用这两个代码后,我的代码就会退出。我无法弄清楚为什么。任何指针都非常欢迎。 (我在Windows上使用Python 3.3.1。)