使用urllib进行网络抓取

时间:2016-12-19 16:32:24

标签: python urllib

我试图做一些简单的网页抓取,我不断收到这个错误,我不知道什么是错的,因为我对python来说还不够新

异常:需要类似字节的对象,而不是'str'

<input..../>

2 个答案:

答案 0 :(得分:6)

您需要将二进制对象解码为字符串:

sourceCodeString = sourceCode.decode()

答案 1 :(得分:0)

首先,您必须将二进制对象解码为字符串

sourceCodeString = sourceCode.decode()

我建议你使用urllib2和BeautifulSoup,互联网上有很多关于使用BeautifulSoup进行网页抓取的教程。