使用BeautifulSoup时遇到错误

时间:2013-06-12 08:27:25

标签: python html beautifulsoup wordnet

我试图从this page中提取以R开头的单词(动词)。但是在执行以下代码时:

from bs4 import BeautifulSoup
import urllib2
url = "http://www.usingenglish.com/reference/phrasal-verbs/r.html"
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content)
print soup.prettify()

抛出的错误是这样的:

  

UnicodeEncodeError:' charmap'编解码器不能对字符u' \ xa9'进行编码。位置57801:字符映射到未定义

有人可以告诉我错误是什么以及如何修复和继续吗?

1 个答案:

答案 0 :(得分:7)

如果你向我们展示整个堆栈跟踪,或者至少在它指向哪一行,那将会容易得多。

无论如何,我打赌,问题在于最后一行。将其更改为:

print(soup.prettify().encode('utf-8'))