用rvest从CSS中剪掉title属性

时间:2017-07-27 15:24:18

标签: css r web-scraping css-selectors rvest

我使用rvest来抓取网页数据。 我有一个来自网站的以下CSS代码:

<abbr class="intabbr" title="2.856.890">2,9M</abbr>

我用

抓取这些数据
library(rvest)
library(dplyr)
n <- read_html("https://www.last.fm/de/music/Fang+Island")
n %>%
html_node("abbr") %>%
html_text()

这给了我&#34; 2M&#34;,但我想得到的是&#34; 2.856.890&#34;。

我对CSS不是很了解:是否可以通过更改html_node()中的表达式来获取我想要的信息?

This post表明这是不可能的,但是this one表明它可能是可能的,因为它会弹出作为页面上的工具提示?

1 个答案:

答案 0 :(得分:1)

使用html_attr获取代码的属性:

n %>%
  html_node("abbr") %>%
  html_attr("title")