使用xpathSApply

时间:2015-07-05 10:53:39

标签: xml r

我目前正在使用一个使用XML readHTMLTable函数的函数,而不是显示表内容而是显示html链接。我在代码行中使用此函数来获取超链接。

y <- xpathSApply(x, './a', xmlGetAttr, "href")

我的问题是某些链接包含在<strong>标记中,并且此函数不会返回链接。如何修改它以返回带或不带<strong>标签的链接?

对不起基本问题,但getNodeSet帮助文件不是非常适合初学者,我不确定我需要搜索什么来解决这个问题。

1 个答案:

答案 0 :(得分:0)

您可以尝试使用descendant-or-self axis - 或使用缩写语法// - 来获取链接,无论它们是否具有父元素<strong>

y <- xpathSApply(x, './/a', xmlGetAttr, "href")