Question

我试图从this page中提取以R开头的单词（动词）。但是在执行以下代码时：

from bs4 import BeautifulSoup
import urllib2
url = "http://www.usingenglish.com/reference/phrasal-verbs/r.html"
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content)
print soup.prettify()

抛出的错误是这样的：

UnicodeEncodeError：＆＃39; charmap＆＃39;编解码器不能对字符u＆＃39; \ xa9＆＃39;进行编码。位置57801：字符映射到未定义

有人可以告诉我错误是什么以及如何修复和继续吗？

Answer 1

如果你向我们展示整个堆栈跟踪，或者至少在它指向哪一行，那将会容易得多。

无论如何，我打赌，问题在于最后一行。将其更改为：

print(soup.prettify().encode('utf-8'))

使用BeautifulSoup时遇到错误

1 个答案: