Question

我非常抱歉，如果这是不可接受的或在其他地方回答，但我花了最后一个半小时寻找有关它的信息，并且提出了我无法使用的任何内容。我是擅长Python的品牌，已经获得了从网站上获取IP的任务。我能够让我的程序读取该网站，但我根本无法弄清楚下一步该做什么。远程接近我想要的每个答案都超出了我的编程能力，我只是不理解它，而且教程实际上并没有解决我遇到的具体问题。再说一次，如果有任何文件或文字我可以阅读而不是浪费时间，请发送给我。

import urllib.request
site = urllib.request.urlopen("http://homer.wcitac.org/~sec290/hwk2/")
print (site.read())
IP = site[10]
print (IP)

我知道，这很简单，但我只是做了一段时间。据我所知，它应该打印回10号（页面上的第9个）字符，所以我有一个起点，所以我可以用冒号找到我想要的字符，但它给了我“TypeError：'HTTPResponse “对象不支持索引”，我不知道这意味着什么。

Answer 1

site变量指向urllib.request.urlopen的返回值。在下一行中，您调用site.read()，它返回一个字符串。简而言之，site没有引用字符串;它引用了一个响应对象，可用于获取字符串内容。

既然您已经知道site.read()会返回一个字符串，为什么不将作为变量捕获并使用呢？

content = site.read()
print(content)

Answer 2

不是打印site.read()的结果，而是将其存储在一个变量中，该变量将是一个包含页面所有文本的字符串，然后您可以根据需要进行操作。

从网站检索数据

2 个答案: