Question

我可以动态地在R中刮取表格数据吗？我有一个网站＆＃34; http://www.nasdaq.com/symbol/goog/option-chain?dateindex=1＆＃34;我希望得到＆＃34; OpenChain＆＃34;表数据＆＃34;希腊人＆＃34;多个日期和多个公司的表数据。我怎么能在R中做到这一点。我想使用R，因为上面的数据需要进一步建模，我想坚持使用一种语言来完成整个过程。提前谢谢。

下面的当前代码返回NULL＆＃34; stock＆＃34;数据帧：

    #Getting the webpage 
    urls= rbindlist(
    lapply(pages, function(x){ 
    url=paste("nasdaq.com/symbol/goog/option-chain?";, sep="") 
    data.frame(url) 
    })
    , fill=TRUE)

    #Getting table data 
    stock=rbindlist(
    apply(urls, 1, function(url){
    doc1=htmlParse(url) 
    stockprices=getNodeSet(doc1,'//*[@id="optionchain"]/div[5]/table/tbody/tr[1]') 
    data.frame(sapply(stockprices, function(x){xmlValue(x)}))
    }
    ), fill = TRUE)

Web在R中刮取特定的表数据

0 个答案: