尝试在lua中使用match和gmatch字符串模式匹配函数来解析xml文件但不能获得预期的结果

时间:2015-09-23 05:09:39

标签: xml parsing lua lua-patterns

我想使用Lua从XML文件中解析和打印特定数据。

以下是我的XML代码片段:

<Service>
<NewInstance ref="E961625723F5FDC8BD550077282E074C">
<Std>DiscoveredElement</Std>
<Key>E961625723F5FDC8BD550077282E074C</Key>
<Attributes>
<Attribute name="TARGET_TYPE" value="j2ee_application" />
<Attribute name="AppType" value="ear" />
<Attribute name="TARGET_GUID" value="E961625723F5FDC8BD550077282E074C" />
<Attribute name="TARGET_NAME"
value="/Farm_b2b4_sys20_b2b4_domain/b2b4_domain/WLS_B2B4a/worklistapp" />
</Attributes>
</NewInstance>
<NewInstance ref="FD8A116D5C8DD2332B024BCBD6A81BD8">
<Std>DiscoveredElement</Std>
<Key>FD8A116D5C8DD2332B024BCBD6A81BD8</Key>
<Attributes>
<Attribute name="TARGET_TYPE" value="composite" />
<Attribute name="SERVICE_TYPE" value="" />
<Attribute name="TARGET_NAME" value="LAB-DB-B-AIX-Grp" />
<Attribute name="TARGET_GUID" value="FD8A116D5C8DD2332B024BCBD6A81BD8" />
</Attributes>
</NewInstance>
</Service>

从这个XML文件中,我想显示与文件中每个NewInstance ref标记对应的TARGET_TYPE和TARGET_NAME的值

我试过两种方式 - Lua代码1:

local file = io.open("sample.xml", "rb")   -- Open file for reading (binary data)
for instance in file:read("*a"):gmatch("<NewInstance ref=\"(.-)\">") do  -- Read whole file content and iterate through attribute matches

TARGET_TYPE = instance:gmatch('TARGET_TYPE.-value=\"(.-)\"')
TARGET_NAME = instance:gmatch('TARGET_NAME.-value=\"(.-)\"')
print("New Instance :", instance)
print("Target Type : ",TARGET_TYPE)
print("Target Name : ",TARGET_NAME)
end
file:close()

我得到的输出是 -

New Instance :  E961625723F5FDC8BD550077282E074C
Target Type :   function: 0050E9C0
Target Name :   function: 0050EA10
New Instance :  FD8A116D5C8DD2332B024BCBD6A81BD8
Target Type :   function: 0050EA60
Target Name :   function: 0050EAB0
Exit code: 0

它正在为目标名称和目标类型选取一些随机值。

Lua代码2:

local file = io.open("sample.xml", "rb")   -- Open file   for reading (binary data)
for instance in file:read("*a"):gmatch("<NewInstance ref=\"(.-)\">") do
TARGET_TYPE = instance:match('TARGET_TYPE.-value="(.-)"')
TARGET_NAME = instance:match('TARGET_NAME.-value="(.-)"')
print("New Instance :", instance)
print("Target Type : ",TARGET_TYPE)
print("Target Name : ",TARGET_NAME)
end
file:close()

这给出了输出:

lua -e "io.stdout:setvbuf 'no'" "prac.lua" 
New Instance :  E961625723F5FDC8BD550077282E074C
Target Type :   nil
Target Name :   nil
New Instance :  FD8A116D5C8DD2332B024BCBD6A81BD8
Target Type :   nil
Target Name :   nil
Exit code: 0

请建议一种方法来检索所需的正确属性值。

1 个答案:

答案 0 :(得分:1)

通常,使用Lua模式(或正则表达式)来解析XML并不是一个好主意。相反,请使用XML解析器。

无论如何,对于这个特殊问题,第一个代码不起作用,因为gmatch是一个迭代器,它不应该像那样使用。

对于第二个代码,模式<NewInstance ref=\"(.-)\">仅捕获ref=部分,您应该在<NewInstance ref=</NewInstance>之间捕获部分:

for instance in xml:gmatch("<NewInstance ref=\".-\">(.-)</NewInstance>") do