我试图做一些简单的网页抓取,我不断收到这个错误,我不知道什么是错的,因为我对python来说还不够新
异常:需要类似字节的对象,而不是'str'
<input..../>
答案 0 :(得分:6)
您需要将二进制对象解码为字符串:
sourceCodeString = sourceCode.decode()
答案 1 :(得分:0)
首先,您必须将二进制对象解码为字符串
sourceCodeString = sourceCode.decode()
我建议你使用urllib2和BeautifulSoup,互联网上有很多关于使用BeautifulSoup进行网页抓取的教程。