用rvest捕捉onclick

时间:2016-03-10 05:39:30

标签: r rvest

我一直在努力用rvest获取一块数据。我正在寻找的数据是值20960,它是insideOpenView(20960)。我如何用rvest完成这个?

我正在使用的html的示例部分是

<tr class="row-1" align="left">
<td style="width:120px;">
<a href="#" onclick='OpenView(20960 );return false;'>
BAKER, JAIME EDWARD</a>
</td>
</tr>

1 个答案:

答案 0 :(得分:2)

我认为这需要一点点击......

library("rvest")
library("stringr")
read_html('<tr class="row-1" align="left">
<td style="width:120px;">
          <a href="#" onclick=\'OpenView(20960 );return false;\'>
          BAKER, JAIME EDWARD</a>
            </td>
            </tr>') %>% 
  html_nodes("a") %>% 
  html_attr("onclick") %>%
  str_extract("(?<=\\().*(?=\\))") %>%    # returns the stuff inside the parens
  str_trim(side="both")                   # trims whitespace from both sides
  [1] "20960"