在Python中解析来自128字节十六进制块的位

时间:2015-07-15 20:24:03

标签: python parsing hex bit-manipulation computer-science

好的,所以我处理的是一个奇怪的解析方案,但是现在它已经开始了。

我有一个脚本,它读取需要解析的字节数。我需要解析那些字节然后返回它们。

实施例

-------------------------------------------------------------------
Description: Log Parameters   : Byte Offset:  0
-------------------------------------------------------------------
-------------------------------------------------------------------
Description: Offset           : Byte Offset:  2-1
-------------------------------------------------------------------
-------------------------------------------------------------------
Description: Request Count    : Byte Offset:  3
-------------------------------------------------------------------
-------------------------------------------------------------------
Description: Reserved         : Byte Offset:  127-4
-------------------------------------------------------------------

所以我的脚本最终能够输出与每一行相关联的十六进制。现在,我需要说,好吧,字节偏移为0,去获取第一个字节并以十六进制返回。好吧,字节偏移量是127-4,得到它,在屏幕上打印十六进制值。

格式为127字节的十六进制存储在字符串中。

HEX String

100000000000000220000000000000003000000000000000
000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000

0x前缀已被剥离并存储为字符串。

此示例中有很多零,但这只是一个随机的情况。 字节偏移可能会波动,所以我试图找出如何基本迭代字节偏移数组并逐步解析它们。

我很奇怪,如果描述占用了这么多字节,按位操作变得更加困难,因为我无法将它们分成32位甚至64位的块。

我想要什么

目前,我有一个以下形式的字节偏移数组:

[0, 2-1, 3, 127-4]

我想迭代每个字节偏移量,从长十六进制字符串中解析它们并打印出来。

问题

如何使用数组中的字节偏移量并将其从十六进制字符串中解析出来。

2 个答案:

答案 0 :(得分:1)

假设您将起始字节#存储在start变量中,并将结束字节#存储在end变量中,然后将十六进制字符串存储在string变量中。

由于每个字节都是两个十六进制数字,因此您只需执行此操作即可以十六进制字符串形式获取字节:

string[start*2:(end+1)*2]

您需要执行end+1,因为在您的示例中,您的字节范围似乎是包含的,但Python切片在范围的末尾是独占的。 More on slicing if you're unfamiliar.

为了使您具体,这是一个最小的工作示例。您可能需要进行解析和按摩以使您的范围看起来像我的,但这是个想法:

string = "100000000000000220000000000000003000000000000000" \
         "000000000000000000000000000000000000000000000000" \
         "000000000000000000000000000000000000000000000000" \
         "000000000000000000000000000000000000000000000000" \
         "000000000000000000000000000000000000000000000000" \
         "0000000000000000"

ranges = ['0', '2-1', '3', '127-4']

for offset in ranges:
    offset_list = offset.split('-')
    if len(offset_list) == 1:
        start = int(offset_list[0])
        end = int(offset_list[0])
    else:
        start = int(offset_list[1])
        end = int(offset_list[0])
    the_bytes = string[start*2:(end+1)*2]
    print('%d-%d: %s' % (start, end, the_bytes))

输出:

0-0: 10
1-2: 0000
3-3: 00
4-127: 00000002200000000000000030000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

答案 1 :(得分:0)

# Input: array of byte values
x='''
100000000000000220000000000000003000000000000000
000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000
'''

# Input: list of offsets
o = ['0', '2-1', '3', '127-4']

# Put everything in a more useful format
x = ''.join(x.split())
o = [item.split('-') for item in o]
o = [[int(item) for item in pair] for pair in o]
for pair in o:
    if len(pair) == 1:
        pair.append(pair[0])

# Display the values
for pair in o:
    print pair, x[pair[1]*2:pair[0]*2+2]