我想知道如何解码某些文字,并找到了一些我要解码的文字:
\xe2\x80\x93
我知道打印它会解决它,但我正在构建一个网络爬虫,因此我需要构建一个包含单词的索引(字典),其中包含单词出现的URL列表。
因此我想做这样的事情:
dic = {}
dic['\xe2\x80\x93'] = 'http://example.com' #this is the url where the word appears
......但是当我这样做时:
print dic
我明白了:
'\xe2\x80\x93'
...而不是–
。
但当我print dic['\xe2\x80\x93']
时,我成功获得了–
。
我如何能够–
print dic
获得<{1}}?
答案 0 :(得分:0)
当您看到\xhh
时,这是一个字符转义序列。在这种情况下,它会显示字符的十六进制值(请参阅:lexical analysis: string-literals)。
您有时会看到\xhh
,并且在使用print
时看到实际字符的原因与difference between __str__
and __repr__
in Python相关。