我正在为Haskell的Alex写一个小语言的词法分析器。
指定语言具有pythonesque显着缩进,每当缩进级别更改时都会发出INDENT标记或DEDENT标记。
在像C这样的传统命令式语言中,你会在词法分析器中保持全局,并用每行的缩进级别更新它。
这在Alex / Haskell中不起作用,因为我无法在Haskell的任何地方存储任何全局数据,并且我不能将所有的lexing规则放在任何monad或任何内容中。
那么,我该怎么做呢?它甚至可能吗?或者我是否必须编写自己的词法分析器并避免使用alex?
答案 0 :(得分:11)
请注意,在其他对空格敏感的语言(如Haskell)中,布局处理确实在词法分析器中完成。 GHC实际上实现了Alex的布局处理。这是来源:
https://github.com/ghc/ghc/blob/master/compiler/parser/Lexer.x
正如jrockway指出的那样,你的问题中有一些严重的错误导致你误入歧途。 “我无法在Haskell的任何地方存储任何全局数据”是在错误的轨道上。首先,你可以具有全局状态,其次,当Alex完全支持规则中的状态转换时,你不应该在这里使用全局状态。
查看Alex提供的AlexState结构,让您通过词法分析器处理状态。然后,看看在GHC的布局实现中如何使用状态来实现布局规则的缩进/取消。 (在GHC的词法分析器中搜索“ - 布局处理”以查看状态是如何被推动和弹出的。)
答案 1 :(得分:5)
我无法使用Haskell
在任何地方存储任何全局数据
事实并非如此;在大多数情况下,像State monad这样的东西就足够了,但也有ST monad。
但是,此任务不需要全局状态。编写解析器由两部分组成;词法分析和语法分析。词法分析只是将一串字符变成一个有意义的标记流。语法分析将标记转换为AST;这是你应该处理缩进的地方。
当您解释缩进时,您将调用处理函数作为缩进级别更改 - 当它增加(嵌套)时,您调用处理程序函数(如果您想跟踪缩进级别,可能会增加一个arg) );当级别降低时,您只需从函数返回相关的AST部分。
(顺便说一句,使用全局变量对我来说也不会出现在命令式语言中 - 如果有的话,它是一个实例变量。状态monad在概念上与此非常相似。)
最后,我认为“我不能把所有的任何规则都放在任何一个monad中”这一短语表明了对monad的某种误解。如果我需要解析并保持全局状态,我的代码将如下所示:
data AST = ...
type Step = State Int AST
parseFunction :: Stream -> Step
parseFunction s = do
level <- get
...
if anotherFunction then put (level + 1) >> parseFunction ...
else parseWhatever
...
return node
parse :: Stream -> Step
parse s = do
if looksLikeFunction then parseFunction ...
main = runState parse 0 -- initial nesting of 0
不是将功能应用程序与(.)
或($)
组合在一起,而是将它们与(>>=)
或(>>)
组合在一起。除此之外,算法是相同的。 (“monad”没有“内部”。)
最后,您可能喜欢应用仿函数:
eval :: Environment -> Node -> Evaluated
eval e (Constant x) = Evaluated x
eval e (Variable x) = Evaluated (lookup e x)
eval e (Function f x y) = (f <$> (`eval` x) <*> (`eval` y)) e
(或
eval e (Function f x y) = ((`eval` f) <*> (`eval` x) <*> (`eval` y)) e
如果你有类似“funcall”的东西......但我离题了。)
有很多关于使用applicative functor,monad和arrows解析的文献;所有这些都有可能解决您的问题。阅读这些内容,看看你得到了什么。