\ u200c而不是真正的半空间

时间:2017-09-10 08:21:52

标签: python

我正在用python抓取一些HTML页面。某些空格中的文本具有半空格字符(\ u200c)。当我在变量中使用文本时,每件事都可以。问题是当我将文本添加到列表时,它显示'\ u200c'而不是真正的半空格。有什么问题?

2 个答案:

答案 0 :(得分:2)

它会显示'\u200c',因为它是__repr__方法为您提供的。但是,尝试使用print()打印它,您应该得到您想要的内容,因为print()使用__str__魔术方法。

答案 1 :(得分:0)

我的猜测是你正在使用python 2.7。开始使用python 3而这些问题将会消失。 Python 2.7需要表示unicode字符,以便知道它们是unicode字符。而python 3将所有字符串作为unicode字符处理,因此您不必担心它。