我有一些原始字符串,我将其转换为十六进制
>>> word_str = "4954640000005200000005a7a90fb36ecd3fa2ca7ec48ca36004acef63f77157ab2f53e3f768ecd9e18547b8c22e21d01bfb6b3de325a27b8fb3acef63f77157ab2f53e3f768ecd9e185b7330fb7c95782fc3d67e7c3a66728dad8b59848c7670c94b29b54d2379e2e7a"
>>> hex_str = word_str.decode('hex')
>>> hex_str = "ITd\x00\x00\x00R\x00\x00\x00\x05\xa7\xa9\x0f\xb3n\xcd?\xa2\xca~\xc4\x8c\xa3`\x04\xac\xefc\xf7qW\xab/S\xe3\xf7h\xec\xd9\xe1\x85G\xb8\xc2.!\xd0\x1b\xfbk=\xe3%\xa2{\x8f\xb3\xac\xefc\xf7qW\xab/S\xe3\xf7h\xec\xd9\xe1\x85\xb73\x0f\xb7\xc9W\x82\xfc=g\xe7\xc3\xa6g(\xda\xd8\xb5\x98H\xc7g\x0c\x94\xb2\x9bT\xd27\x9e.z"
通过查看ascii表,我想它一次需要两个数字并将它们从ascii表中转换为适当的值,如
49 -> I
54 -> T
64 -> d
00 -> \x00
00 -> \x00
但在某些时候这条规则会中断
52 -> \x00R (00 and 52)
然后继续一次拿两个数字
00 -> \x00
00 -> \x00
00 -> \x00
05 -> \x05
a7 -> \xa7
a9 -> \xa9
0f -> \x0f
这里需要同时使用2对(b3
和63
)而不是1对,其中它不会将b3
转换为适当的值(来自扩展的ascii)表)
b36e -> \xb3n
这里cd成为\xcd?
...
cd -> \xcd?
我的目标是在C ++中实现相同的(variable.decode(' hex')),但我需要了解发生了什么,这里使用了哪种算法?
答案 0 :(得分:0)
您要问的是字符串的表示,用于以人类可读的格式打印它。字符串本身包含原始十六进制字符串中每个字节的值(每个字节从两个原始数字派生)。
字符串中的某些字节是不可打印或无法用ASCII表示的字符。对于那些,Python使用转义码:\x
后跟两个原始的十六进制数字。
在您的示例b36e -> \xb3n
中,Python会将b3
转换为\xb3
。下一个字节6e
是小写n
的ASCII,由于它是可打印的,因此它是逐字逐句的。 Python不是"一次取两个;"每个字节都是单独处理的。
所以基本上,如果你想做同样的事情"在C ++中,您可能希望使用\x
转义逐字添加32到126(包括)之间的所有字符以及该范围之外的任何字符。
我不确定你真的想在C ++中做同样的事情;也许你可以解释为什么你想用C ++生成一个Python字符串表示。