在StartElement(QXmlStreamReader)

时间:2018-04-23 16:01:32

标签: xml qt qxmlstreamreader

所以,我正在尝试阅读一个中等大小的XML文档。它的结构如下:

<project identifier="project1">
    <author>Joe Smith</author>
    <author2>Rick Jones</author2>
    <path>projects/internal/project2</path>
    <version>1.51</version>
</project>
<project identifier="project2">
     <author>Terry Chimes</author>
     <author>Janie Jones</author>
     <path>projects/external/project2</path>
     <version>19.77</version>
</project>

......依此类推,数百个项目。

我正在使用Qt5.10的QXmlStreamReader,这可能是由虐待狂创建(或记录)。

我可以使用project找到每个xmlReader.readNextStartElement,或者通过逐个标记来查找,直到找到具有内部属性的标记(此文件中只有project个标记具有属性)。

但是一旦我读取其中一个父元素,QXmlStreamReader就会将每个标记吸收到其结束</project>标记。问题是我需要获取一些数据,在这种情况下,<path></path>标签内的内容。

我可以使用xmlReader.readElementText(QXmlStreamReader::IncludeChildElements检索所有笨拙的数据,但这只是一个没有标记的大数据转储。

有谁知道我如何“倒带”并阅读内部标签?或者阻止流阅读器向前冲并吸取所有数据?

1 个答案:

答案 0 :(得分:1)

最可能的解释是你做错了什么,QXmlStreamReader在解析文档时不应该跳过内部元素。你没有提供任何你的源代码,因此无法确定你做错了什么。

这是我的代码示例,它非常类似于你的代码,在MacOS 10.13.2上使用Qt 5.9.2:

#include <QCoreApplication>
#include <QDebug>
#include <QXmlStreamReader>
#include <QFile>
#include <QHash>

int main(int argc, char *argv[])
{
    QCoreApplication a(argc, argv);

    if (argc != 2) {
        qWarning() << "Usage: " << argv[0] << " <file>";
        return 1;
    }

    QFile file(argv[1]);
    if (!file.open(QIODevice::ReadOnly)) {
        qWarning() << "Failed to open file " << argv[1] << " for reading";
        return 1;
    }

    QXmlStreamReader reader(&file);
    QString currentProjectId;
    QHash<QString,QString> pathByProjectId;
    while(!reader.atEnd())
    {
        reader.readNext();

        if (reader.isStartDocument()) {
            continue;
        }

        if (reader.isEndDocument()) {
            break;
        }

        if (reader.isStartElement())
        {
            QStringRef elementName = reader.name();
            if (elementName == "project") {
                QXmlStreamAttributes attrs = reader.attributes();
                currentProjectId = attrs.value("identifier").toString();
            }
            else if (elementName == "path") {
                pathByProjectId[currentProjectId] = reader.readElementText(QXmlStreamReader::IncludeChildElements);
            }

            continue;
        }
    }

    for(auto it = pathByProjectId.constBegin(),
        end = pathByProjectId.constEnd(); it != end; ++it)
    {
        qDebug() << "Path for project " << it.key() << ": " << it.value();
    }

    file.close();

    return 0;
}

以下是我为此示例程序提供的稍微修改过的示例:

<?xml version="1.0" encoding="UTF-8"?>
<body>
<project identifier="project1">
    <author>Joe Smith</author>
    <author2>Rick Jones</author2>
    <path>projects/internal/project1</path>
    <version>1.51</version>
</project>
<project identifier="project2">
     <author>Terry Chimes</author>
     <author>Janie Jones</author>
     <path>projects/external/project2</path>
     <version>19.77</version>
 </project>
 </body>

我添加到您的示例中的是XML版本/编码声明+高级body标记,以防止QXmlStreamReader认为第一个project标记是整个文档的根元素。我还改变了第一个项目的路径,使其与第二个项目的路径不同。

这是我得到的输出:

Path for project  "project1" :  "projects/internal/project1"
Path for project  "project2" :  "projects/external/project2"