使用LPeg re模块解析XML类型的文件

时间:2015-05-29 20:24:24

标签: xml lua pattern-matching lpeg

我正在尝试学习LPeg的re module,这是非常有趣的经历,特别是因为官方文档非常好。

然而,有一些主题在那里似乎很难解释。例如named group capture构造:{:name: p :}

考虑以下示例,我不明白为什么它不匹配:

print(re.compile
  [[item <- ('<' {:tag: %w+!%w :} '>' item+ '</' =tag '>') / %w+!%w]]
  :match[[<person><name>James</name><address>Earth</address></person>]])

-- outputs nil

有谁能帮我理解这里出了什么问题?我想了很多,看起来我似乎错过了一些重要的东西。

1 个答案:

答案 0 :(得分:1)

这是一个迟到的答案,但您可以尝试以下模式

result = re.compile[[
  item <- ({| %s* '<' {:tag: %w+ :} %s* '>' (item / %s* { (!(%s* '<') .)+ }) %s* '</' =tag '>' |})+
]]:match[[
<person>
    <name>
    James
    </name>
    <address>Earth</address>
</person>
]]

使用表格捕获来解析XML w / whitespace以删除元素文本

tag = "person"
[1] = {
  tag = "name"
  [1] = "James"
}
[2] = {
  tag = "address"
  [1] = "Earth"
}