我一直在尝试在Python中获取.text,将html代码转换为可读文本,但仍然没有运气。
假设我有以下代码:
import urllib
url = ['http://google.com','http://bing.com']
for i in url:
html = urllib.urlopen(i).read()
print html.encode('utf-8').text
一旦我删除了最后一行中的.text,代码就可以工作但我已经看到人们在教程中使用它而没有任何问题。知道为什么我不能让它工作?洛尔
非常感谢!
答案 0 :(得分:1)
import urllib
url = ['http://google.com','http://bing.com']
for i in url:
html = urllib.urlopen(i).read()
print html
无需encode
或text
,只需在html
后打印read()
即可。我建议您使用python-requests
。