将字符串解析为Ast

时间:2019-10-05 13:09:09

标签: parsing haskell tree abstract-syntax-tree

我需要一些我进行解析的功能的指导。

这是我的语法(我无法更改):

Expr -> Int | - Expr | + Expr Expr | * Expr Expr
Int -> Digit | Digit Int
Digit -> 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

我的数据类型(我应该填写Min和Mult,我想我是对的):

data Ast = Num Int | Sum Ast Ast | Mult Ast Ast | Min Ast | Var String  deriving (Eq, Show)

因此,首先我做了一个tokenizer方法,将字符串分成字符列表:

tokenize :: String -> [String]
tokenize [] = []
tokenize xs @ (x : xs')
    | x `elem` t = [x] : tokenize xs'
    | isDigit x = [y | y <- takeWhile isDigit xs] : (tokenize (dropWhile isDigit xs))
    | otherwise = tokenize xs'
        where t = ['+', '-', '*']

这可以正常工作。

接下来,我做了parseExpr :: [String] -> (Ast, [String])。这样做是通过tokenize :: String -> [String]制作的列表并递归生成Ast(至少我认为是)

parseExpr :: [String] -> (Ast,[String])
parseExpr [] = error "Error!"
parseExpr (s:ss) | all isDigit s = (Num (read s),ss)
             | s == "-" = let (e,ss') = parseExpr ss in (Min e,ss')
             | s == "*" = (Mult e e',ss'')
             | s == "+" = (Sum e e',ss'') where
                          (e,ss') = parseExpr ss
                          (e',ss'') = parseExpr ss'

我现在正在努力的是如何将它们组合到功能parse :: String -> Ast中。我这样做的尝试(可能还很遥远)是这样的。 parseExpr产生格式为(Ast, [String])的输出:

parse :: String -> Ast
parse [] = error "Empty string"
parse str = parseExpr x
  where x = tokenize str

我的问题是这样:

让我们说我有简单的字符串str = "+ 1 4"

tokenize str = ["+", "1", "4"]

以递归方式将其运行到parseExpr中,遍历标记化的列表并产生以下输出:

(Sum (Num 1) (Num 4),[])

它输出Ast和一个空字符串列表。

现在提出问题。我需要这样做,以便parse "+ 1 4"返回(Sum (Num 1) (Num 4))我可以通过哪些方式进行此操作?我应该将parseExpr的输出视为一个列表,并从第0个索引中获取Ast,还是不可能?我是否需要更改parseExpr在列表中的显示方式? 任何帮助是极大的赞赏!顺便说一句,我不能更改函数的任何定义,也不能更改Ast的语法或数据类型。

1 个答案:

答案 0 :(得分:1)

(Sum (Num 1) (Num 4),[])是一个元组,您需要第一个元素。

您可以使用函数fst从元组中获取第一个元素。

parse :: String -> Ast
parse [] = error "Empty string"
parse str = fst $ parseExpr x
  where x = tokenize str