Boost ptree读取xml中的结束标记xml验证不正确

时间:2018-04-12 19:08:05

标签: c++ xml boost ptree

我正在尝试使用C ++中的Boost Ptrees进行一些简单的xml解析。但是,如果没有结束标记,read_xml函数似乎只会抛出错误。下面抛出一个错误。 例如:

<?xml version="1.0" encoding="utf-8"?>
<Grandparent>
<Parent>test<Parent>
</Grandparent>

请注意,Parent的结束标记没有结束正斜杠,而是作为错误抛出。即使缺少像<Parent>test这样的结束标记也会引发预期的有效错误。

但是,如果结束标记字符串与开始标记字符串不匹配,则不会引发错误。例如:

<?xml version="1.0" encoding="utf-8"?>
<Grandparent>
<Parent>test</Child>
</Grandparent>

以上解析得很好。我的代码非常简单如下:

using boost::property_tree::ptree;
ptree pt;
read_xml(xmlpath, pt);

我在这里有什么东西可以忽略吗?

1 个答案:

答案 0 :(得分:1)

是。

最重要的是:Boost Property Tree不是XML库。

其次,引擎盖下使用的rapidxml实现具有关闭标签验证作为选择加入:

if (Flags & parse_validate_closing_tags)
{
    // Skip and validate closing tag name
    Ch *closing_name = text;
    skip<node_name_pred, Flags>(text);
    if (!internal::compare(node->name(), node->name_size(), closing_name, text - closing_name, true))
        BOOST_PROPERTY_TREE_RAPIDXML_PARSE_ERROR("invalid closing tag name", text);
}

幸运的是,Boost Property没有选择加入。事实上,它不会让你选择加入:

/// Text elements should be put in separate keys,
/// not concatenated in parent data.
static const int no_concat_text  = 0x1;
/// Comments should be omitted.
static const int no_comments     = 0x2;
/// Whitespace should be collapsed and trimmed.
static const int trim_whitespace = 0x4;

inline bool validate_flags(int flags)
{
    return (flags & ~(no_concat_text | no_comments | trim_whitespace)) == 0;
}

不允许使用其他标志。

如果您需要XML解析,我建议您转向XML库。