我正在编写一个带有Happy的JavaScript解析器,我需要匹配一个正则表达式。我不想完全解析正则表达式,只需将其存储为字符串。
我AST的相关部分如下:
data PrimaryExpr
-- | Literal integer
= ExpLitInt Integer
-- | Literal strings
| ExpLitStr String
-- | Identifier
| ExpId String
-- | Bracketed expression
| ExpBrackExp Expression
-- | This (current object)
| ExpThis
-- | Regular Expression
| ExpRegex String
-- | Arrays
| ExpArray ArrayLit
-- | Objects
| ExpObject [(PropName, Assignment)]
deriving Show
这是相关的快乐代码:
primaryExpr :: { PrimaryExpr }
: LITINT { ExpLitInt $1 }
| LITSTR { ExpLitStr $1 }
| ID { ExpId $1 }
| THIS { ExpThis }
| regex { ExpRegex $1 }
| arrayLit { ExpArray $1 }
| objectLit { ExpObject $1 }
| '(' expression ')' { ExpBrackExp $2 }
我的问题是,我该如何定义我的regex
非终端?这种结构对吗?
regex :: { String }
: '/' whatHere? '/' { $2 }
答案 0 :(得分:3)
您应该将正则表达式定义为词法分析器识别的终端(即LITREGEX)。
primaryExpr :: { PrimaryExpr }
: LITINT { ExpLitInt $1 }
| LITSTR { ExpLitStr $1 }
| LITREGEX { ExpRegex $1 }
| ID { ExpId $1 }
| THIS { ExpThis }
| arrayLit { ExpArray $1 }
| objectLit { ExpObject $1 }
| '(' expression ')' { ExpBrackExp $2 }
答案 1 :(得分:3)
要回答评论中的问题,需要更多空间。
类似的东西(间隔和评论):
/ forward slash
( \\. either: an escaped character
| [^\[/\\] anything which isn't / or [ or \
| \[ a character class containing:
[^\]]* anything which isn't ] any number of times
\]
)* any number of times
/ forward slash
冷凝的:
/(\\.|[^\[/\\]|\[[^\]]*\])*/