Question

我正在尝试解析html网站，但不知怎的，我的代码无效。

testrun = htmlTreeParse（“网址”，useInternalNodes = T）

然后我得到......

＆LT; div class =“md”＆gt; ＆LT; p＆gt;我被误导了..＆lt; p> ...

我想抓住这句话（我被误导了），所以我做的是

xpathSApply（testrun，“”// div [@class ='md'] // p“，xmlGetAttr，”href“）

但这会吐出NULL值..当我在这里做错了可以告诉我吗？

Answer 1

使用xmlValue。 xmlGetAttr调用xmlAttrs并用于返回节点的属性。

xpathSApply(testrun,"//div[@class = 'md']/p", xmlValue)