我使用rvest来抓取网页数据。 我有一个来自网站的以下CSS代码:
<abbr class="intabbr" title="2.856.890">2,9M</abbr>
我用
抓取这些数据library(rvest)
library(dplyr)
n <- read_html("https://www.last.fm/de/music/Fang+Island")
n %>%
html_node("abbr") %>%
html_text()
这给了我&#34; 2M&#34;,但我想得到的是&#34; 2.856.890&#34;。
我对CSS不是很了解:是否可以通过更改html_node()中的表达式来获取我想要的信息?
答案 0 :(得分:1)
使用html_attr
获取代码的属性:
n %>%
html_node("abbr") %>%
html_attr("title")