我一直在努力用rvest获取一块数据。我正在寻找的数据是值20960,它是insideOpenView(20960)。我如何用rvest完成这个?
我正在使用的html的示例部分是
<tr class="row-1" align="left">
<td style="width:120px;">
<a href="#" onclick='OpenView(20960 );return false;'>
BAKER, JAIME EDWARD</a>
</td>
</tr>
答案 0 :(得分:2)
我认为这需要一点点击......
library("rvest")
library("stringr")
read_html('<tr class="row-1" align="left">
<td style="width:120px;">
<a href="#" onclick=\'OpenView(20960 );return false;\'>
BAKER, JAIME EDWARD</a>
</td>
</tr>') %>%
html_nodes("a") %>%
html_attr("onclick") %>%
str_extract("(?<=\\().*(?=\\))") %>% # returns the stuff inside the parens
str_trim(side="both") # trims whitespace from both sides
[1] "20960"