从网页抓取内容

时间:2016-06-02 11:46:48

标签: r web-scraping rvest

我的问题是关于从以下网站抓取数据:

https://www.google.dk/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=swarovski+london&tbs=lf:1,lf_ui:4&tbm=lcl&start=0&rllag=51537201,-182623,5184&rlha=0

理想情况下,我想通过阅读商店名称以及商店是否关闭到R来计算城市中(活跃)商店的数量。

我没有运气试过以下内容:

尝试1 -

url <- "https://www.google.dk/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=swarovski%20london&rflfq=1&rlha=0&rllag=51537201,-182623,5184&tbm=lcl&tbs=lf:1,lf_ui:4&rlfi=hd:;si:"

read_html(url)

尝试2 -

webdata <- html(url)

webdata %>%
        html_nodes("._rl") %>%
        html_text()

有谁知道如何解决这个问题?

非常感谢。

亲切的问候,

丹尼尔

0 个答案:

没有答案