R,htmlTreeParse和xpathSApply

时间:2012-08-27 23:49:32

标签: r html-parsing

我正在尝试解析html网站,但不知怎的,我的代码无效。

  

testrun = htmlTreeParse(“网址”,useInternalNodes = T)

然后我得到......

< div class =“md”> < p>我被误导了..< p> ...

我想抓住这句话(我被误导了),所以我做的是

  

xpathSApply(testrun,“”// div [@class ='md'] // p“,xmlGetAttr,”href“)

但这会吐出NULL值..当我在这里做错了可以告诉我吗?

1 个答案:

答案 0 :(得分:5)

使用xmlValuexmlGetAttr调用xmlAttrs并用于返回节点的属性。

xpathSApply(testrun,"//div[@class = 'md']/p", xmlValue)