我正在尝试读取.txt文件的内容。文件中包含的是URL列表。我需要用urllib打开每个URL。我收到如下所示的错误。有人可以解释我如何解决它吗?
data =(urllib.request.urlopen(r"C:\Users\diese\OneDrive\Documentos\GitHub\MCPP_diego_ramirez\Proyectof\urlsDow.txt")
for line in data:
print (line)
URLError: <urlopen error unknown url type: c>
答案 0 :(得分:1)
首先从文本文件中提取网址。然后使用urllib访问每个URL。 您可以从official documentation找到有关读取和写入文件的详细信息。
为简单起见,我假设您要将检索到的数据存储在列表中
import urllib
with open(path-to-url-files) as fh:
urls = fh.readlines()
retrieved_pages = []
for url in urls:
retrieved_pages.append(urllib.request.urlopen(url).read())
现在,您可以根据需要打印每个检索到的网址行。
for page in retrieved_pages:
for line in page:
print(line)
print("\n\n")