如何使用alex / haskell执行python样式的缩进/ dedent标记?

时间:2009-10-03 06:48:54

标签: parsing haskell

我正在为Haskell的Alex写一个小语言的词法分析器。

指定语言具有pythonesque显着缩进,每当缩进级别更改时都会发出INDENT标记或DEDENT标记。

在像C这样的传统命令式语言中,你会在词法分析器中保持全局,并用每行的缩进级别更新它。

这在Alex / Haskell中不起作用,因为我无法在Haskell的任何地方存储任何全局数据,并且我不能将所有的lexing规则放在任何monad或任何内容中。

那么,我该怎么做呢?它甚至可能吗?或者我是否必须编写自己的词法分析器并避免使用alex?

2 个答案:

答案 0 :(得分:11)

请注意,在其他对空格敏感的语言(如Haskell)中,布局处理确实在词法分析器中完成。 GHC实际上实现了Alex的布局处理。这是来源:

https://github.com/ghc/ghc/blob/master/compiler/parser/Lexer.x

正如jrockway指出的那样,你的问题中有一些严重的错误导致你误入歧途。 “我无法在Haskell的任何地方存储任何全局数据”是在错误的轨道上。首先,你可以具有全局状态,其次,当Alex完全支持规则中的状态转换时,你不应该在这里使用全局状态。

查看Alex提供的AlexState结构,让您通过词法分析器处理状态。然后,看看在GHC的布局实现中如何使用状态来实现布局规则的缩进/取消。 (在GHC的词法分析器中搜索“ - 布局处理”以查看状态是如何被推动和弹出的。)

答案 1 :(得分:5)

  

我无法使用Haskell

在任何地方存储任何全局数据

事实并非如此;在大多数情况下,像State monad这样的东西就足够了,但也有ST monad

但是,此任务不需要全局状态。编写解析器由两部分组成;词法分析和语法分析。词法分析只是将一串字符变成一个有意义的标记流。语法分析将标记转换为AST;这是你应该处理缩进的地方。

当您解释缩进时,您将调用处理函数作为缩进级别更改 - 当它增加(嵌套)时,您调用处理程序函数(如果您想跟踪缩进级别,可能会增加一个arg) );当级别降低时,您只需从函数返回相关的AST部分。

(顺便说一句,使用全局变量对我来说也不会出现在命令式语言中 - 如果有的话,它是一个实例变量。状态monad在概念上与此非常相似。)

最后,我认为“我不能把所有的任何规则都放在任何一个monad中”这一短语表明了对monad的某种误解。如果我需要解析并保持全局状态,我的代码将如下所示:

data AST = ...
type Step = State Int AST

parseFunction :: Stream -> Step
parseFunction s = do
   level <- get
   ...
   if anotherFunction then put (level + 1) >> parseFunction ...
   else parseWhatever
   ...
   return node

parse :: Stream -> Step
parse s = do
   if looksLikeFunction then parseFunction ...

main = runState parse 0 -- initial nesting of 0

不是将功能应用程序与(.)($)组合在一起,而是将它们与(>>=)(>>)组合在一起。除此之外,算法是相同的。 (“monad”没有“内部”。)

最后,您可能喜欢应用仿函数:

eval :: Environment -> Node -> Evaluated
eval e (Constant x) = Evaluated x
eval e (Variable x) = Evaluated (lookup e x)
eval e (Function f x y) = (f <$> (`eval` x) <*> (`eval` y)) e

(或

eval e (Function f x y) = ((`eval` f) <*> (`eval` x) <*> (`eval` y)) e

如果你有类似“funcall”的东西......但我离题了。)

有很多关于使用applicative functor,monad和arrows解析的文献;所有这些都有可能解决您的问题。阅读这些内容,看看你得到了什么。