如何使用urllib读取txt.file

时间:2018-05-13 22:56:29

标签: python url

我正在尝试读取.txt文件的内容。文件中包含的是URL列表。我需要用urllib打开每个URL。我收到如下所示的错误。有人可以解释我如何解决它吗?

data =(urllib.request.urlopen(r"C:\Users\diese\OneDrive\Documentos\GitHub\MCPP_diego_ramirez\Proyectof\urlsDow.txt") 
for line in data: 
      print (line)

URLError: <urlopen error unknown url type: c>

1 个答案:

答案 0 :(得分:1)

首先从文本文件中提取网址。然后使用urllib访问每个URL。 您可以从official documentation找到有关读取和写入文件的详细信息。

为简单起见,我假设您要将检索到的数据存储在列表中

import urllib

with open(path-to-url-files) as fh:
    urls = fh.readlines()

retrieved_pages = []
for url in urls:
    retrieved_pages.append(urllib.request.urlopen(url).read())

现在,您可以根据需要打印每个检索到的网址行。

for page in retrieved_pages:
    for line in page:
        print(line)
    print("\n\n")