在python中解码文本

时间:2013-04-04 11:34:33

标签: decoding

我想知道如何解码某些文字,并找到了一些我要解码的文字:

\xe2\x80\x93

我知道打印它会解决它,但我正在构建一个网络爬虫,因此我需要构建一个包含单词的索引(字典),其中包含单词出现的URL列表。

因此我想做这样的事情:

dic = {}
dic['\xe2\x80\x93'] = 'http://example.com' #this is the url where the word appears

......但是当我这样做时:

print dic

我明白了:

'\xe2\x80\x93'

...而不是–

但当我print dic['\xe2\x80\x93']时,我成功获得了–

我如何能够– print dic获得<{1}}?

1 个答案:

答案 0 :(得分:0)

当您看到\xhh时,这是一个字符转义序列。在这种情况下,它会显示字符的十六进制值(请参阅:lexical analysis: string-literals)。

您有时会看到\xhh,并且在使用print时看到实际字符的原因与difference between __str__ and __repr__ in Python相关。