作为一个学习项目,我目前正在尝试在Haskell中为ELF文件格式构建解析器。 Elf二进制文件有一个称为程序头的部分,该头包含一个专用于标志的单词。程序头包含两个用于标志的字段:一个用于64位标志,一个用于32位标志,按顺序排列。
像这样:
data ProgramHeader =
ProgramHeader {
getSegmentType :: SegmentType
, get64SegmentFlags :: SegmentFlag
, getOffset :: Offset
, getVirtualAddress :: Address
, getPhysicalAddress :: Address
, getFileSize :: Size
, getMemorySize :: Size
, get32SegmentFlags :: SegmentFlag
, getAlignment :: Either Word32 Word64
}
解析看起来像这样:
parseProgramHeader :: WordSize -> Endianness -> Get Program
parseProgramHeader wordsize en = do
st <- parseSegmentType
flags64 <- parseSegmentFlag
offset <- parseVariant wordsize en
virtualAddress <- parseVariant wordsize en
physicalAddress <- parseVariant wordsize en
fileSize <- parseVariant wordsize en
memorySize <- parseVariant wordsize en
flags32 <- parseSegmentFlag
a <- parseVariableWord wordsize
return $ ProgramHeader st flags64 offset virtualAddress physicalAddress fileSize memorySize flags32 a
现在我希望能够将这两个SegmentFlag
字段合并为一个字段:
data ProgramHeader =
ProgramHeader {
getSegmentType :: SegmentType
, getSegmentFlags :: SegmentFlag
, getOffset :: Offset
, getVirtualAddress :: Address
, getPhysicalAddress :: Address
, getFileSize :: Size
, getMemorySize :: Size
, getAlignment :: Either Word32 Word64
}
但是,我仍然需要解析两次标记字(在每个相应的位置),只保留相关的字。
我的直觉是,这意味着我只需要为相应的单词大小绑定parseSegmentFlag值;如果不是这样,仍然会调用parseSegmentFlag,但丢弃该值。 在伪代码中:
parseProgramHeader :: WordSize -> Endianness -> Get Program
parseProgramHeader wordsize en = do
st <- parseSegmentType
if wordsize == Bit64
then
do flags <- parseSegmentFlag
else
discard $ parseSegmentFlag
[...]
if wordsize == Bit32
then do flags <- parseSegmentFlag
else do discard $ parseSegmentFlag
现在我完全不知道如何在Haskell中优雅地执行。有任何想法吗?指针?
谢谢!
答案 0 :(得分:4)
另一个选择,只需保留代码,然后选择相关的版本,即
。... -- as before
let flags = case ws of
Bit32 -> flags32
Bit64 -> flags64
return $ ProgramHeader st flags ...
(我使用case
代替if
,因为如果你碰巧添加了另一个案例,你会在这里收到警告而不是落到你选择的默认分支上