Question

我想从以下网站的其他标签中抓取股票数据：http://www.tsetmc.com/Loader.aspx?ParTree=151311&i=35178706978554988但它们所有人都具有相同的URL。当我尝试使用诸如read_html()，html_nodes()和html_text()之类的“ rvest”库函数时，我只能从主选项卡中抓取数据。在选项卡之间切换会得到相同的结果。我尝试使用以下代码，但仍然无法获得适当的结果。

以前，我可以使用“ rvest”提取存储在“”部分的“ InsCode”和“ ZTitad”等信息。但是因为所有其他标签的数据都没有写在“ html-source”部分，所以我不知道该怎么做。

    #Scraping Libraries
    library(rvest)
    library(jsonlite)

    #Target website
    my_url<-"http://www.tsetmc.com/Loader.aspx?ParTree=151311&i=35178706978554988"
    pagesource <- read_html(my_url)
    content<- pagesource %>% html_node("script") %>% html_text()
    data <- fromJSON(content)

最终，我想将“حقیقی-حقوقی”选项卡数据导出到数据框中以继续进行其他分析。

如何使用R从菜单标签中具有类似“＃” URL的网站抓取数据？

0 个答案: