Question

我已经下载了一组html文件并将我保存的文件路径保存到.txt文件中。它在新行上有每条路径。我想查看列表中的第一个文件，然后遍历整个列表，打开文件并提取数据，然后再转到下一个文件。

我的代码可以直接放入（对于第一个文件）的单个路径，因为：

path = r'C:\path\to\file.html'

并且如果我使用：

遍历文本文件，则有效

file_list_fp = r'C:\path\to\file_with_pathlist.txt'
with open(file_list_fp, 'r') as file_list:
for filepath in file_list:
    pathend = filepath.find('\n')
    path = file[:pathend]
    q = open(path, 'r').read()

但是当我尝试使用以下任一路径获取单个路径时失败：

with open(file_list_fp, 'r') as file_list:

    path_n = file_list.readline()
    end = path_n.find('\n')
    path_bad1 = path_n[:end]

或：

with open(file_list_fp, 'r') as file_list:    

    path_bad2 = file_list.readline().split('\n')[0]

使用这两个代码后，我的代码就会退出。我无法弄清楚为什么。任何指针都非常欢迎。（我在Windows上使用Python 3.3.1。）

'文件路径'使用导致Python 3中的程序退出

0 个答案: