从网站检索数据

时间:2014-10-06 18:24:42

标签: python

我非常抱歉,如果这是不可接受的或在其他地方回答,但我花了最后一个半小时寻找有关它的信息,并且提出了我无法使用的任何内容。我是擅长Python的品牌,已经获得了从网站上获取IP的任务。我能够让我的程序读取该网站,但我根本无法弄清楚下一步该做什么。远程接近我想要的每个答案都超出了我的编程能力,我只是不理解它,而且教程实际上并没有解决我遇到的具体问题。再说一次,如果有任何文件或文字我可以阅读而不是浪费时间,请发送给我。

import urllib.request
site = urllib.request.urlopen("http://homer.wcitac.org/~sec290/hwk2/")
print (site.read())
IP = site[10]
print (IP)

我知道,这很简单,但我只是做了一段时间。据我所知,它应该打印回10号(页面上的第9个)字符,所以我有一个起点,所以我可以用冒号找到我想要的字符,但它给了我“TypeError:'HTTPResponse “对象不支持索引”,我不知道这意味着什么。

2 个答案:

答案 0 :(得分:1)

site变量指向urllib.request.urlopen的返回值。在下一行中,您调用site.read(),它返回一个字符串。简而言之,site没有引用字符串;它引用了一个响应对象,可用于获取字符串内容。

既然您已经知道site.read()会返回一个字符串,为什么不将 作为变量捕获并使用呢?

content = site.read()
print(content)

答案 1 :(得分:0)

不是打印site.read()的结果,而是将其存储在一个变量中,该变量将是一个包含页面所有文本的字符串,然后您可以根据需要进行操作。