我正在使用scrapy进行使用python进行网络爬行。在抓取时,我有一些未正确编码的字符,如'\ xa0','\ x0259'。任何帮助如何在python中处理它们?
答案 0 :(得分:1)
您可以使用unicode字符串类型(http://docs.python.org/2/tutorial/introduction.html#unicode-strings),方法是使用u
添加所有字符实例。例如u'\xa0'
和u'\x0259'
。 unicode-string python docs还提供了一些其他方法来编码和解码这些字符串和字符。