Web在R中刮取特定的表数据

时间:2016-09-06 10:54:30

标签: r xml web-scraping

我可以动态地在R中刮取表格数据吗?我有一个网站" http://www.nasdaq.com/symbol/goog/option-chain?dateindex=1"我希望得到" OpenChain"表数据"希腊人"多个日期和多个公司的表数据。我怎么能在R中做到这一点。我想使用R,因为上面的数据需要进一步建模,我想坚持使用一种语言来完成整个过程。提前谢谢。

下面的当前代码返回NULL" stock"数据帧:

    #Getting the webpage 
    urls= rbindlist(
    lapply(pages, function(x){ 
    url=paste("nasdaq.com/symbol/goog/option-chain?";, sep="") 
    data.frame(url) 
    })
    , fill=TRUE)

    #Getting table data 
    stock=rbindlist(
    apply(urls, 1, function(url){
    doc1=htmlParse(url) 
    stockprices=getNodeSet(doc1,'//*[@id="optionchain"]/div[5]/table/tbody/tr[1]') 
    data.frame(sapply(stockprices, function(x){xmlValue(x)}))
    }
    ), fill = TRUE)

0 个答案:

没有答案