python如何将原始字符串转换为十六进制?

时间:2017-04-30 16:32:29

标签: python c++ sockets hex raw-data

我有一些原始字符串,我将其转换为十六进制

>>> word_str = "4954640000005200000005a7a90fb36ecd3fa2ca7ec48ca36004acef63f77157ab2f53e3f768ecd9e18547b8c22e21d01bfb6b3de325a27b8fb3acef63f77157ab2f53e3f768ecd9e185b7330fb7c95782fc3d67e7c3a66728dad8b59848c7670c94b29b54d2379e2e7a"

>>> hex_str = word_str.decode('hex')
>>> hex_str = "ITd\x00\x00\x00R\x00\x00\x00\x05\xa7\xa9\x0f\xb3n\xcd?\xa2\xca~\xc4\x8c\xa3`\x04\xac\xefc\xf7qW\xab/S\xe3\xf7h\xec\xd9\xe1\x85G\xb8\xc2.!\xd0\x1b\xfbk=\xe3%\xa2{\x8f\xb3\xac\xefc\xf7qW\xab/S\xe3\xf7h\xec\xd9\xe1\x85\xb73\x0f\xb7\xc9W\x82\xfc=g\xe7\xc3\xa6g(\xda\xd8\xb5\x98H\xc7g\x0c\x94\xb2\x9bT\xd27\x9e.z"

通过查看ascii表,我想它一次需要两个数字并将它们从ascii表中转换为适当的值,如

49 -> I
54 -> T 
64 -> d
00 -> \x00  
00 -> \x00

但在某些时候这条规则会中断

52 -> \x00R (00 and 52)

然后继续一次拿两个数字

00 -> \x00 
00 -> \x00 
00 -> \x00
05 -> \x05 
a7 -> \xa7 
a9 -> \xa9 
0f -> \x0f 

这里需要同时使用2对(b363)而不是1对,其中它不会将b3转换为适当的值(来自扩展的ascii)表)

b36e -> \xb3n

这里cd成为\xcd? ...

 cd ->  \xcd?

我的目标是在C ++中实现相同的(variable.decode(' hex')),但我需要了解发生了什么,这里使用了哪种算法?

1 个答案:

答案 0 :(得分:0)

您要问的是字符串的表示,用于以人类可读的格式打印它。字符串本身包含原始十六进制字符串中每个字节的值(每个字节从两个原始数字派生)。

字符串中的某些字节是不可打印或无法用ASCII表示的字符。对于那些,Python使用转义码:\x后跟两个原始的十六进制数字。

在您的示例b36e -> \xb3n中,Python会将b3转换为\xb3。下一个字节6e是小写n的ASCII,由于它是可打印的,因此它是逐字逐句的。 Python不是"一次取两个;"每个字节都是单独处理的。

所以基本上,如果你想做同样的事情"在C ++中,您可能希望使用\x转义逐字添加32到126(包括)之间的所有字符以及该范围之外的任何字符。

我不确定你真的想在C ++中做同样的事情;也许你可以解释为什么你想用C ++生成一个Python字符串表示。