Megaparsec,使用StateT和ParsecT回溯用户状态

时间:2016-09-30 19:38:40

标签: haskell megaparsec

使用Megaparsec 5。 在this guide之后,我可以通过合并StateTParsecT来实现回溯用户状态(非定义类型应该是显而易见的/不相关的):

type MyParser a = StateT UserState (ParsecT Dec T.Text Identity) a

如果我运行解析器p :: MyParser a,就像这样:

parsed = runParser (runStateT p initialUserState) "" input

parsed的类型是:

Either (ParseError Char Dec) (a, UserState)

这意味着,如果出现错误,用户状态将丢失。

在这两种情况下都有办法吗?

修改 如果出现错误,我是否可以使用自定义错误组件而不是Dec(5.0中引入的功能)并将用户状态封装在那里?

2 个答案:

答案 0 :(得分:2)

您可以将自定义错误组件与observing函数结合使用(有关详细信息,请参阅this great post):

{-# LANGUAGE RecordWildCards #-}

module Main where

import Text.Megaparsec
import qualified Data.Set as Set
import Control.Monad.State.Lazy

data MyState = MyState Int deriving (Ord, Eq, Show)
data MyErrorComponent = MyErrorComponent (Maybe MyState) deriving (Ord, Eq, Show)

instance ErrorComponent MyErrorComponent where
    representFail _ = MyErrorComponent Nothing 
    representIndentation _ _ _= MyErrorComponent Nothing 

type Parser = StateT MyState (Parsec MyErrorComponent String)

trackState :: Parser a -> Parser a
trackState parser = do
    result <- observing parser -- run parser but don't fail right away
    case result of
        Right x -> return x -- if it succeeds we're done here
        Left ParseError {..} -> do
            state <- get -- read the current state to add it to the error component
            failure errorUnexpected errorExpected $
                if Set.null errorCustom then Set.singleton (MyErrorComponent $ Just state) else errorCustom

在上面的剪切中,observing函数有点像try / catch块,它捕获了一个解析错误,然后读取当前状态并将其添加到自定义错误组件。当runParser返回ParseError时会返回自定义错误组件。

以下是如何使用此功能的演示:

a = trackState $ do
    put (MyState 6)
    string "foo"

b = trackState $ do
    put (MyState 5)
    a

main = putStrLn (show $ runParser (runStateT b (MyState 0)) "" "bar") 

实际上你可能想要做一些更聪明的事情(例如我想你也可以在遍历堆栈时添加你经历的整个状态堆栈。)

答案 1 :(得分:1)

您可以尝试将ParserT夹在两个State之间,例如

type MyParser a = StateT UserState (ParsecT Dec T.Text (State UsersState)) a

编写专用putmodify操作,在更改外部状态后,使用State将整个状态复制到内部put monad中。

这样,即使解析失败,你也可以从内部State monad获得最后一个“失败前的状态”。