我正在尝试解析html网站,但不知怎的,我的代码无效。
然后我得到......testrun = htmlTreeParse(“网址”,useInternalNodes = T)
< div class =“md”> < p>我被误导了..< p> ...
我想抓住这句话(我被误导了),所以我做的是
xpathSApply(testrun,“”// div [@class ='md'] // p“,xmlGetAttr,”href“)
但这会吐出NULL值..当我在这里做错了可以告诉我吗?
答案 0 :(得分:5)
使用xmlValue
。 xmlGetAttr
调用xmlAttrs
并用于返回节点的属性。
xpathSApply(testrun,"//div[@class = 'md']/p", xmlValue)