我从网站上删除了数据,但对于某些项目,它显示我的错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\2019' in position 4: ordinal not in range(128)
我甚至把#34;# - - 编码:utf-8 - - "在文档的顶部,但它没有工作。请帮忙。
答案 0 :(得分:1)
要么始终考虑unicode
内容,要么完全删除unicode
内容。发生错误的原因是您(或您正在使用的某些库方法)尝试将utf-8
内容转换为ascii而不忽略错误。
# Ignore unicode content
content_string = content_string.encode('ascii', 'ignore')
# Or make sure you handle unicode content as such. It would have been
# easier if you're using Python3x.
# -- coding: utf-8 --
的目的是允许将Unicode内容显式添加到python代码文件中,而不是设置默认编码。
# -- coding: utf-8 --
book_name = 'Les Misérables'