我目前正在使用一个使用XML readHTMLTable
函数的函数,而不是显示表内容而是显示html链接。我在代码行中使用此函数来获取超链接。
y <- xpathSApply(x, './a', xmlGetAttr, "href")
我的问题是某些链接包含在<strong>
标记中,并且此函数不会返回链接。如何修改它以返回带或不带<strong>
标签的链接?
对不起基本问题,但getNodeSet帮助文件不是非常适合初学者,我不确定我需要搜索什么来解决这个问题。
答案 0 :(得分:0)
您可以尝试使用descendant-or-self axis - 或使用缩写语法//
- 来获取链接,无论它们是否具有父元素<strong>
:
y <- xpathSApply(x, './/a', xmlGetAttr, "href")