双重转义的unicode网址

时间:2016-10-28 01:08:38

标签: python json parsing unicode

我在python中使用cjson库解析JSON。该字段包含包含转义网址的文字,如下所示:http:\/\/domain.com\/index.html。但是,当我使用cjson解析字段时,我得到一个如下所示的Unicode对象:

`u'Payload text http:\\/\\/domain.com\\/index.html'`

看起来URL被转义两次(?)我试图解码它,但我总是得到相同的结果。例如:

payload['text'].encode('ascii', 'ignore').decode('string_escape')

这将返回相同的响应,双重转义的URL。我该怎么办?我知道我在这里犯了一些概念错误,并且不知道unicode编码是如何工作的。

1 个答案:

答案 0 :(得分:0)

如果您打印u'Payload text http:\\/\\/domain.com\\/index.html',则会看到结果为Payload text http:\/\/domain.com\/index.html。它没有被双重转义,你会看到字符串的repr而不是字面值。