我非常喜欢Python构造模块的声明性语法,用于定义双向(二进制文本)解析器/构建器。
我最近开始专注于golang,并且想知道是否有人看过(或者可能是受人尊敬的作者)golang的类似库。
如果您从未使用过construct模块,那么您基本上构建了一个Python对象的声明性树,您可以提供Python对象树并获取二进制blob,或者将二进制blob解析为Python对象树。
构造网页的一个简单示例:
>>> PascalString2 = ExprAdapter(PascalString,
... encoder = lambda obj, ctx: Container(length = len(obj), data = obj),
... decoder = lambda obj, ctx: obj.data
... )
>>> PascalString2.parse("\x05hello")
'hello'
>>> PascalString2.build("i'm a long string")
"\x11i'm a long string"
来自显示硬盘MBR解析器的源的稍微复杂的示例。
mbr = Struct("mbr",
HexDumpAdapter(Bytes("bootloader_code", 446)),
Array(4,
Struct("partitions",
Enum(Byte("state"),
INACTIVE = 0x00,
ACTIVE = 0x80,
),
BitStruct("beginning",
Octet("head"),
Bits("sect", 6),
Bits("cyl", 10),
),
Enum(UBInt8("type"),
Nothing = 0x00,
FAT12 = 0x01,
XENIX_ROOT = 0x02,
XENIX_USR = 0x03,
FAT16_old = 0x04,
Extended_DOS = 0x05,
FAT16 = 0x06,
FAT32 = 0x0b,
FAT32_LBA = 0x0c,
NTFS = 0x07,
LINUX_SWAP = 0x82,
LINUX_NATIVE = 0x83,
_default_ = Pass,
),
BitStruct("ending",
Octet("head"),
Bits("sect", 6),
Bits("cyl", 10),
),
UBInt32("sector_offset"), # offset from MBR in sectors
UBInt32("size"), # in sectors
)
),
Const("signature", b"\x55\xAA"),
)
这里有一个TCP/IP stack示例,它真实地展示了构造模型的强大功能,能够将一小部分定义块组合成一个解析器/生成器。
我知道有PEG / EBNF解析器生成器,但我希望看到一些更漂亮的东西。
答案 0 :(得分:0)
这与Python的Construct包不同,但Go的版本为Yacc:
Yacc的语法类似于EBNF,因此它可能不符合您的标准,但它被广泛使用和理解,所以我认为值得一提。