我正在使用C ++和libtidy来解析html页面。但libtidy的文档是如此不完整,我几乎无法理解API函数的作用。我想要的是从html dom节点获取特定的属性值,例如:
<table class="xxxx" ...
我想得到&#34; xxxx&#34;出。我怎样才能做到这一点?我是否必须像这样遍历表节点下的所有属性?
if (tidyNodeIsTABLE(tdNode))
{
TidyAttr attr;
for (attr=tidyAttrFirst(tdNode); attr; attr=tidyAttrNext(attr))
{
if (tidyAttrGetId(attr) == TidyAttr_CLASS)
{
std::string value = tidyAttrValue(attr);
break;
}
}
}
还是有更方便的方法吗?感谢。