网站从聚合网站上报废价格

时间:2016-02-19 08:50:55

标签: r web-scraping rvest

这对某些人来说可能非常简单。但我无法理解它。我试图从网站上提取价格和其他信息。

我正在使用Rvest进行报废。我不是来自CS背景所以我无法理解将要使用的html节点的类输入。我正在查看类似酒店'对于类似酒店的价格。我的代码尝试如下。请告诉我代码中的缺点。

    url='http://www.yatra.com/hotels/hotels-in-coorg/club-mahindra-madikeri-coorg'

index <- url %>%
    read_html() %>%
    html_nodes("#carousel_one")

count <- index %>%
    html_nodes("span") %>%
    html_text() %>% 

location <- counts %>%
    html_nodes("p") %>%
    html_text()

type <- counts %>%
    html_nodes("a") %>%
    html_text()

好的我转了一圈,但它是针对一个单独的节点。我希望在一个命令中获得所有节点。

我的代码显然不对。也有些人能够理解为这些信息找到正确的标签和类所涉及的方法。

是的,我已经阅读过TNC条件了。

1 个答案:

答案 0 :(得分:0)

我可以获得代码。但又失去了一点逻辑。

代码是

index <- url %>%
    read_html() %>%
    html_nodes("#container .crousel")

fetch <- index %>%
    html_nodes("span") %>%
    html_text()