如何使用R从菜单标签中具有类似“#” URL的网站抓取数据?

时间:2019-08-05 16:20:45

标签: r web-scraping

我想从以下网站的其他标签中抓取股票数据:http://www.tsetmc.com/Loader.aspx?ParTree=151311&i=35178706978554988但它们所有人都具有相同的URL。当我尝试使用诸如read_html()html_nodes()html_text()之类的“ rvest”库函数时,我只能从主选项卡中抓取数据。在选项卡之间切换会得到相同的结果。我尝试使用以下代码,但仍然无法获得适当的结果。

以前,我可以使用“ rvest”提取存储在“”部分的“ InsCode”和“ ZTitad”等信息。但是因为所有其他标签的数据都没有写在“ html-source”部分,所以我不知道该怎么做。

    #Scraping Libraries
    library(rvest)
    library(jsonlite)

    #Target website
    my_url<-"http://www.tsetmc.com/Loader.aspx?ParTree=151311&i=35178706978554988"
    pagesource <- read_html(my_url)
    content<- pagesource %>% html_node("script") %>% html_text()
    data <- fromJSON(content)

最终,我想将“حقیقی-حقوقی”选项卡数据导出到数据框中以继续进行其他分析。

0 个答案:

没有答案