有没有办法用html_attributes过滤html_nodes?

时间:2017-09-18 14:58:55

标签: r web-scraping rvest

我开始使用R并有一个问题,我正在尝试收集html页面的价格列表。这是我向R询问价格时能够获得的例子

<h3 class="item_price" itemprop="price" content="16450">                                        16 450&nbsp;€
</h3>

我知道我在<h3 class="item_price" itemprop="price" content="1234">之后有35个价格 是否可以通过h3元素和属性class =“item_price”进行过滤,然后询问内容属性值? 谢谢你的帮助。

1 个答案:

答案 0 :(得分:2)

是的可能 - 来源:rvest :: html_attr文档

movie <- read_html("http://www.imdb.com/title/tt1490017/")
cast <- html_nodes(movie, "#titleCast span.itemprop")
html_text(cast)
html_name(cast)
html_attrs(cast)
html_attr(cast, "class")

如果您有更复杂的问题,请提供可重复的示例。