Question

我一直在尝试在Python中获取.text，将html代码转换为可读文本，但仍然没有运气。

假设我有以下代码：

import urllib

url = ['http://google.com','http://bing.com']

for i in url:
    html = urllib.urlopen(i).read()
    print html.encode('utf-8').text

一旦我删除了最后一行中的.text，代码就可以工作但我已经看到人们在教程中使用它而没有任何问题。知道为什么我不能让它工作？洛尔

非常感谢！

Answer 1

import urllib

url = ['http://google.com','http://bing.com']

for i in url:
    html = urllib.urlopen(i).read()
    print html

无需encode或text，只需在html后打印read()即可。我建议您使用python-requests。