在qt中解析XML并获取树标记结构

时间:2017-05-10 17:33:57

标签: c++ xml qt xml-parsing

我需要将c ++(!11)/ QT中的XML文件解析为包含每个值及其xml标记父结构的向量。

我是QT的新手,我知道他们的图书馆有一些不错的选择。但是,我发现的大部分内容都集中在那些提前知道标签名称的人身上。对我来说,我需要更通用的东西。标签名称(和值)与我的目的无关,可以是任何东西,我的重点是保存每个值的标签结构。采取这种方法的最佳方法是什么? QDomDocument?

*注意:实际的xmls在树结构长度上要复杂得多。

示例输入

的test.xml

<MainTag>
<description>Test Description</description>
<type>3</type>
<source>
    <description>Source test Description1</description>
    <type>4</type>
</source>
<source>
    <description>Source test Description2</description>
    <type>5</type>
    <name>
        <element>1</element>
    </name>
</source>

</MainTag>

示例输出

(c ++向量中包含的字符串行):

description=Test Description
type=3
source.description=Source test Description1
source.type=4
source.description=Source test Description2
source.type=5
source.name.element=1

1 个答案:

答案 0 :(得分:3)

在解析XML文件时,我发现导航XML的DOM比使用流解析器更灵活,因为您的代码不太了解元素的顺序,而是更多地关注结构和内容。

对于DOM导航,您可以使用QDomDocument及相关类:

解析未知XML的示例代码

此代码解析XML并提取标记名称及其文本。它不提取属性也不提取空节点。

注意:我已将给定示例<MainTag>的结束标记更正为</MainTag>

#include <QtXml>
#include <QtCore>
#include <vector>
#include <iostream>

// Recursive function to parse the XML
void parseXML(const QDomElement& root, const QString& baseName, std::vector<QString>& v)
{
  // Extract node value, if any
  if (!baseName.isEmpty() && !root.firstChild().nodeValue().isEmpty()) { // the first child is the node text
    v.push_back(baseName + "=" + root.firstChild().nodeValue());
  }

  // Parse children elements
  for (auto element = root.firstChildElement(); !element.isNull(); element = element.nextSiblingElement()) {
    parseXML(element, baseName + "." + element.tagName(), v);
  }
}

int main(int argc, char* argv[])
{
  const QString content = "<MainTag>"
                          "<description>Test Description</description>"
                          "<type>3</type>"
                          "<source>"
                          "    <description>Source test Description1</description>"
                          "    <type>4</type>"
                          "</source>"
                          "<source>"
                          "    <description>Source test Description2</description>"
                          "    <type>5</type>"
                          "    <name>"
                          "        <element>1</element>"
                          "    </name>"
                          "</source>"
                          "</MainTag>";
  std::vector<QString> v;

  QDomDocument xml("xml");
  xml.setContent(content);
  parseXML(xml.documentElement(), "", v); // root has no base name, as indicated in expected output

  for (auto it = v.begin(); it != v.end(); ++it) {
    std::cout << it->toStdString() << std::endl;
  }

  return 0;
}

文件中的DOM

要从文件填充DOM,请使用下面的代码更改setContent行(为简单起见,省略错误检查):

QFile file(filePath);
file.open(QFile::ReadOnly);
xml.setContent(file.readAll());