我正在用python抓取一些HTML页面。某些空格中的文本具有半空格字符(\ u200c)。当我在变量中使用文本时,每件事都可以。问题是当我将文本添加到列表时,它显示'\ u200c'而不是真正的半空格。有什么问题?
答案 0 :(得分:2)
它会显示'\u200c'
,因为它是__repr__
方法为您提供的。但是,尝试使用print()
打印它,您应该得到您想要的内容,因为print()
使用__str__
魔术方法。
答案 1 :(得分:0)
我的猜测是你正在使用python 2.7。开始使用python 3而这些问题将会消失。 Python 2.7需要表示unicode字符,以便知道它们是unicode字符。而python 3将所有字符串作为unicode字符处理,因此您不必担心它。