Rvest操纵并从HTML中提取价值

时间:2016-08-17 12:01:15

标签: html css r

使用R. 我把html中的getBrandlist作为

 <div>\n  <span class="txt edittext">BrandName1 </span>\n  <span 
 class="cnt" data-val="116">(42)</span>\n</div>
 <div>\n  <span class="txt edittext">BrandName2 </span>\n  <span 
 class="cnt" data-val="116">(62)</span>\n</div> 
 ......

现在我有数字62.我希望提取与此值对应的BrandName2。 我尝试使用 html_node(getBrandlist, css = '.cnt') %>% html_attr() 我该如何解决这个问题。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:2)

你可以做到

library(rvest)
doc <- read_html('<div>\n  <span class="txt edittext">BrandName1 </span>\n  <span 
 class="cnt" data-val="116">(42)</span>\n</div>
 <div>\n  <span class="txt edittext">BrandName2 </span>\n  <span 
 class="cnt" data-val="116">(62)</span>\n</div> ')
html_node(doc, xpath = "//span[text()='(62)']/preceding-sibling::span") %>% html_text
# [1] "BrandName2 "