如何在Haskell中将解析器组合多达n次?

时间:2018-04-10 10:20:23

标签: parsing haskell parsec parser-combinators trifecta

我试图在Haskell中组合解析器,以便我可以解析某些模式n次。为了说明,想象一下我想从输入中解析最多八位数。我知道我可以使用count中的Text.Parser.Combinators来解析n次出现,例如:

import Text.Parser.Char        (digit)
import Text.Parser.Combinators (count)

eightDigits :: Parser [Char]
eightDigits = count 8 digit

但如果它找不到8位数,则会失败。我还可以使用some来解析一个或多个数字:

import Text.Parser.Char        (digit)
import Text.Parser.Combinators (some)

someDigits :: Parser [Char]
someDigits = some digit

上面的问题是它可能消耗的数字比我想要的多。最后,我可以使用try,它组合了可能消耗输入的解析器,并在失败时返回到它开始的位置:

import Text.Parser.Char        (digit)
import Text.Parser.Combinators (count, try)
import Control.Applicative     ((<|>))

twoOrThreeDigits :: Parser [Char]
twoOrThreeDigits = try (count 3 digit) <|> count 2 digit

虽然这可以扩展到最多8次重复,但它不可扩展也不优雅,所以问题是我如何组合解析器来解析1到n次之间的模式?

1 个答案:

答案 0 :(得分:6)

您可以构建一个many - 类似的组合器,其上限为:

upto :: Int -> Parser a -> Parser [a]
upto n p | n > 0 = (:) <$> try p <*> upto (n-1) p <|> return []
upto _ _ = return []

对于1到n,一个many1 - 像组合子:

upto1 :: Int -> Parser a -> Parser [a]
upto1 n p | n > 0 = (:) <$> p <*> upto (n-1) p
upto1 _ _ = return []

一个简短的演示:

> map (parse (upto 8 digitChar) "") ["", "123", "1234567890"]
[Right "",Right "123",Right "12345678"]