我想在this tutorial之后从网页上获取所有文字。但是我似乎无法使用get_text()从网页上获取所有文本,而是收到错误:
UnicodeEncodeError:'charmap'编解码器无法编码字符'\ u1d90' 位置2473:字符映射到
以下是我的源代码:
soup = bs.BeautifulSoup(source,'lxml').encode('UTF-8')
关于我哪里出错的任何想法?我已经在Stack Overflow上关注了其他几个答案,并尝试了:
<PropertyGroup>
<ExcludeFoldersFromDeployment>
packages
</ExcludeFoldersFromDeployment>
</PropertyGroup>
但得到错误:
AttributeError:'bytes'对象没有属性'get_text'