在符号中有条件地绑定或忽略值

时间:2018-03-13 09:19:52

标签: parsing haskell monads

作为一个学习项目,我目前正在尝试在Haskell中为ELF文件格式构建解析器。 Elf二进制文件有一个称为程序头的部分,该头包含一个专用于标志的单词。程序头包含两个用于标志的字段:一个用于64位标志,一个用于32位标志,按顺序排列。

像这样:

data ProgramHeader =
    ProgramHeader {
        getSegmentType :: SegmentType
      , get64SegmentFlags :: SegmentFlag
      , getOffset :: Offset
      , getVirtualAddress :: Address
      , getPhysicalAddress :: Address
      , getFileSize :: Size
      , getMemorySize :: Size
      , get32SegmentFlags :: SegmentFlag
      , getAlignment :: Either Word32 Word64
    }

解析看起来像这样:

parseProgramHeader :: WordSize -> Endianness -> Get Program
parseProgramHeader wordsize en = do
  st <- parseSegmentType
  flags64 <- parseSegmentFlag
  offset <- parseVariant wordsize en
  virtualAddress <- parseVariant wordsize en
  physicalAddress <- parseVariant wordsize en
  fileSize <- parseVariant wordsize en
  memorySize <- parseVariant wordsize en
  flags32 <- parseSegmentFlag
  a <- parseVariableWord wordsize
  return $ ProgramHeader st flags64 offset virtualAddress physicalAddress fileSize memorySize flags32 a

现在我希望能够将这两个SegmentFlag字段合并为一个字段:

data ProgramHeader =
    ProgramHeader {
        getSegmentType :: SegmentType
      , getSegmentFlags :: SegmentFlag
      , getOffset :: Offset
      , getVirtualAddress :: Address
      , getPhysicalAddress :: Address
      , getFileSize :: Size
      , getMemorySize :: Size
      , getAlignment :: Either Word32 Word64
    }

但是,我仍然需要解析两次标记字(在每个相应的位置),只保留相关的字。

我的直觉是,这意味着我只需要为相应的单词大小绑定parseSegmentFlag值;如果不是这样,仍然会调用parseSegmentFlag,但丢弃该值。 在伪代码中:

parseProgramHeader :: WordSize -> Endianness -> Get Program
parseProgramHeader wordsize en = do
  st <- parseSegmentType
  if wordsize == Bit64
      then
        do flags <- parseSegmentFlag
      else
        discard $ parseSegmentFlag
  [...]
  if wordsize == Bit32
    then do flags <- parseSegmentFlag
    else do discard $ parseSegmentFlag

现在我完全不知道如何在Haskell中优雅地执行。有任何想法吗?指针?

谢谢!

1 个答案:

答案 0 :(得分:4)

另一个选择,只需保留代码,然后选择相关的版本,即

...  -- as before
let flags = case ws of
                Bit32 -> flags32
                Bit64 -> flags64
return $ ProgramHeader st flags ...

(我使用case代替if,因为如果你碰巧添加了另一个案例,你会在这里收到警告而不是落到你选择的默认分支上