使用Megaparsec 5。
在this guide之后,我可以通过合并StateT
和ParsecT
来实现回溯用户状态(非定义类型应该是显而易见的/不相关的):
type MyParser a = StateT UserState (ParsecT Dec T.Text Identity) a
如果我运行解析器p :: MyParser a
,就像这样:
parsed = runParser (runStateT p initialUserState) "" input
parsed
的类型是:
Either (ParseError Char Dec) (a, UserState)
这意味着,如果出现错误,用户状态将丢失。
在这两种情况下都有办法吗?
修改 如果出现错误,我是否可以使用自定义错误组件而不是Dec(5.0中引入的功能)并将用户状态封装在那里?
答案 0 :(得分:2)
您可以将自定义错误组件与observing
函数结合使用(有关详细信息,请参阅this great post):
{-# LANGUAGE RecordWildCards #-}
module Main where
import Text.Megaparsec
import qualified Data.Set as Set
import Control.Monad.State.Lazy
data MyState = MyState Int deriving (Ord, Eq, Show)
data MyErrorComponent = MyErrorComponent (Maybe MyState) deriving (Ord, Eq, Show)
instance ErrorComponent MyErrorComponent where
representFail _ = MyErrorComponent Nothing
representIndentation _ _ _= MyErrorComponent Nothing
type Parser = StateT MyState (Parsec MyErrorComponent String)
trackState :: Parser a -> Parser a
trackState parser = do
result <- observing parser -- run parser but don't fail right away
case result of
Right x -> return x -- if it succeeds we're done here
Left ParseError {..} -> do
state <- get -- read the current state to add it to the error component
failure errorUnexpected errorExpected $
if Set.null errorCustom then Set.singleton (MyErrorComponent $ Just state) else errorCustom
在上面的剪切中,observing
函数有点像try
/ catch
块,它捕获了一个解析错误,然后读取当前状态并将其添加到自定义错误组件。当runParser
返回ParseError
时会返回自定义错误组件。
以下是如何使用此功能的演示:
a = trackState $ do
put (MyState 6)
string "foo"
b = trackState $ do
put (MyState 5)
a
main = putStrLn (show $ runParser (runStateT b (MyState 0)) "" "bar")
实际上你可能想要做一些更聪明的事情(例如我想你也可以在遍历堆栈时添加你经历的整个状态堆栈。)
答案 1 :(得分:1)
您可以尝试将ParserT
夹在两个State
之间,例如
type MyParser a = StateT UserState (ParsecT Dec T.Text (State UsersState)) a
编写专用put
和modify
操作,在更改外部状态后,使用State
将整个状态复制到内部put
monad中。
这样,即使解析失败,你也可以从内部State
monad获得最后一个“失败前的状态”。