如何使用libtidy从html dom节点获取特定属性

时间:2015-02-11 09:11:39

标签: c++ html-parsing htmltidy

我正在使用C ++和libtidy来解析html页面。但libtidy的文档是如此不完整,我几乎无法理解API函数的作用。我想要的是从html dom节点获取特定的属性值,例如:

<table class="xxxx" ...

我想得到&#34; xxxx&#34;出。我怎样才能做到这一点?我是否必须像这样遍历表节点下的所有属性?

if (tidyNodeIsTABLE(tdNode))
{
    TidyAttr attr;
    for (attr=tidyAttrFirst(tdNode); attr; attr=tidyAttrNext(attr))
    {
        if (tidyAttrGetId(attr) == TidyAttr_CLASS)
        {
            std::string value = tidyAttrValue(attr);
            break;
        }
    }
}

还是有更方便的方法吗?感谢。

0 个答案:

没有答案