我已经阅读了几个关于python如何处理unicode的SO问题和博客文章,但我仍然有点困惑。我正在通过scrapy进行搜索,并从网页上获取此信息:u'Isla de Se\xf1orita'
。它应该是u'Isla de Señorita'
。我知道我可以做点像......
>>> u"ñ"
u'\xf1'
>>> u"ñ".encode("utf-8")
'\xc3\xb1'
但我应该怎么做呢?我可以从这些字节中取出u"ñ"
吗?我只想要 - 这样我就可以把它保存到django模型中的一个字段中。感谢。
答案 0 :(得分:1)
>>> print '\xc3\xb1'
ñ
也许我不清楚你的意思是“把它拿回来”?