Question

我已经阅读了几个关于python如何处理unicode的SO问题和博客文章，但我仍然有点困惑。我正在通过scrapy进行搜索，并从网页上获取此信息：u'Isla de Se\xf1orita'。它应该是u'Isla de Señorita'。我知道我可以做点像......

>>> u"ñ"
u'\xf1'
>>> u"ñ".encode("utf-8")
'\xc3\xb1'

但我应该怎么做呢？我可以从这些字节中取出u"ñ"吗？我只想要 - 这样我就可以把它保存到django模型中的一个字段中。感谢。

Answer 1

你仍然在那里。它的编码方式不同。在我的python解释器中查看此操作：

>>> print '\xc3\xb1'
ñ

也许我不清楚你的意思是“把它拿回来”？