我试图从this page中提取以R开头的单词(动词)。但是在执行以下代码时:
from bs4 import BeautifulSoup
import urllib2
url = "http://www.usingenglish.com/reference/phrasal-verbs/r.html"
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content)
print soup.prettify()
抛出的错误是这样的:
UnicodeEncodeError:' charmap'编解码器不能对字符u' \ xa9'进行编码。位置57801:字符映射到未定义
有人可以告诉我错误是什么以及如何修复和继续吗?
答案 0 :(得分:7)
如果你向我们展示整个堆栈跟踪,或者至少在它指向哪一行,那将会容易得多。
无论如何,我打赌,问题在于最后一行。将其更改为:
print(soup.prettify().encode('utf-8'))