Question

使用Megaparsec 5。在this guide之后，我可以通过合并StateT和ParsecT来实现回溯用户状态（非定义类型应该是显而易见的/不相关的）：

type MyParser a = StateT UserState (ParsecT Dec T.Text Identity) a

如果我运行解析器p :: MyParser a，就像这样：

parsed = runParser (runStateT p initialUserState) "" input

parsed的类型是：

Either (ParseError Char Dec) (a, UserState)

这意味着，如果出现错误，用户状态将丢失。

在这两种情况下都有办法吗？

修改如果出现错误，我是否可以使用自定义错误组件而不是Dec（5.0中引入的功能）并将用户状态封装在那里？

Answer 1

您可以将自定义错误组件与observing函数结合使用（有关详细信息，请参阅this great post）：

{-# LANGUAGE RecordWildCards #-}

module Main where

import Text.Megaparsec
import qualified Data.Set as Set
import Control.Monad.State.Lazy

data MyState = MyState Int deriving (Ord, Eq, Show)
data MyErrorComponent = MyErrorComponent (Maybe MyState) deriving (Ord, Eq, Show)

instance ErrorComponent MyErrorComponent where
    representFail _ = MyErrorComponent Nothing 
    representIndentation _ _ _= MyErrorComponent Nothing 

type Parser = StateT MyState (Parsec MyErrorComponent String)

trackState :: Parser a -> Parser a
trackState parser = do
    result <- observing parser -- run parser but don't fail right away
    case result of
        Right x -> return x -- if it succeeds we're done here
        Left ParseError {..} -> do
            state <- get -- read the current state to add it to the error component
            failure errorUnexpected errorExpected $
                if Set.null errorCustom then Set.singleton (MyErrorComponent $ Just state) else errorCustom

在上面的剪切中，observing函数有点像try / catch块，它捕获了一个解析错误，然后读取当前状态并将其添加到自定义错误组件。当runParser返回ParseError时会返回自定义错误组件。

以下是如何使用此功能的演示：

a = trackState $ do
    put (MyState 6)
    string "foo"

b = trackState $ do
    put (MyState 5)
    a

main = putStrLn (show $ runParser (runStateT b (MyState 0)) "" "bar")

实际上你可能想要做一些更聪明的事情（例如我想你也可以在遍历堆栈时添加你经历的整个状态堆栈。）

Answer 2

您可以尝试将ParserT夹在两个State之间，例如

type MyParser a = StateT UserState (ParsecT Dec T.Text (State UsersState)) a

编写专用put和modify操作，在更改外部状态后，使用State将整个状态复制到内部put monad中。

这样，即使解析失败，你也可以从内部State monad获得最后一个“失败前的状态”。

Megaparsec，使用StateT和ParsecT回溯用户状态

2 个答案: