考虑一种完全可选分号的语言,几乎完全是糖,即:
;; foo; bar;;;;
有效foo bar foobar
有效if (+1); foo
在语义上与if (+1) foo
不同,因此;
不能被视为空格以下是一个示例解析器:
{-# LANGUAGE OverloadedStrings #-}
import Text.Trifecta
import Text.Trifecta.Delta
import Text.PrettyPrint.ANSI.Leijen (putDoc, (<>), linebreak)
import Control.Monad.Trans.State.Strict
import Control.Applicative
type TestParser a = StateT Int Parser a
data AST a = Foo a | Bar a deriving (Show)
pFoo :: TestParser (AST (Delta, Int))
pFoo = curry Foo <$ string "foo" <*> position <* modify (+1) <*> get
pBar :: TestParser (AST (Delta, Int))
pBar = curry Bar <$ string "bar" <*> position <*> get
pStmt :: TestParser (AST (Delta, Int))
pStmt = semi *> pStmt <|> pFoo <|> pBar <?> "statement"
pTest :: TestParser [AST (Delta, Int)]
pTest = some pStmt
main :: IO ()
main
= do let res = parseByteString (evalStateT pTest 0)
(Directed "(test)" 0 0 0 0) ";;foo;bar;\nfoo;; foobarbar;;"
case res of
Success ast
-> print ast
Failure errdoc
-> putDoc (errdoc <> linebreak)
我遇到这样一个解析器的问题是我需要能够跳过分号而不提交解析pStmt
。目前发生以下错误:
(test):2:18: error: unexpected
EOF, expected: statement
foo;; foobarbar;;<EOF>
这是因为它需要一个语句(在semi *> pStmt
中),但是因为堆叠的分号可以在表达式的开头和结尾都加糖,我不能确定我真的希望/解析一个在我预期之前之一。
我开发的一个hack是在我的AST中使用Nop
作为构造函数,但我真的不想这样做 - 感觉就像一个黑客,并且在某些文档中会有分号的数量大大增加了内存使用量。
我正在寻找解决方案/建议。
尝试所需语法的EBNF形式:
expr = "foo" | "bar"
expr with sugar = expr | ";"
program = { [white space], expr with sugar, [white space] }
答案 0 :(得分:5)
好的,这是:
pStmt = pFoo <|> pBar
pWhiteStmt = do
many whitespace
p <- pStmt
many whitespace
return p
pTest = do
many semi
pS <- sepEndBy pWhiteStm (some semi)
eof
return pS
测试一下:
> parse pTest "" ";;foo;bar;\nfoo;; foo;bar;bar;;"
Right ["foo","bar","foo","foo","bar","bar"]
> parse pTest "" ";;foo;bar;\nfoo;; foobarbar;;"
Left (line 2, column 10):
unexpected 'b'
expecting ";" or end of input
如果我们希望有一个有效的"; foobarbar;"
,那么我们需要将pWhiteStmt
解析器更改为下一个:
pWhiteStmt = do
many whitespace
p <- some pStmt
many whitespace
return p
检查一下:
> parse pTest "" ";;foo;bar;\nfoo;; foobarbar;;"
Right [["foo"],["bar"],["foo"],["foo","bar","bar"]]
最后,如果我们仍希望有效"; foo bar baz;"
,那么我们还需要将pTest
功能更改为下一个:
pTest = do
many semi
pS <- sepEndBy (some pWhiteStm) (some semi)
eof
return pS
并测试它
> parse pTest "" ";;foo;bar;\nfoo;; foo bar bar;;"
Right [[["foo"]],[["bar"]],[["foo"]],[["foo"],["bar"],["bar"]]]
如果我们有多个括号,则需要将return p
替换为return (concat p)
pWhiteStmt