我可以动态地在R中刮取表格数据吗?我有一个网站" http://www.nasdaq.com/symbol/goog/option-chain?dateindex=1"我希望得到" OpenChain"表数据"希腊人"多个日期和多个公司的表数据。我怎么能在R中做到这一点。我想使用R,因为上面的数据需要进一步建模,我想坚持使用一种语言来完成整个过程。提前谢谢。
下面的当前代码返回NULL" stock"数据帧:
#Getting the webpage
urls= rbindlist(
lapply(pages, function(x){
url=paste("nasdaq.com/symbol/goog/option-chain?";, sep="")
data.frame(url)
})
, fill=TRUE)
#Getting table data
stock=rbindlist(
apply(urls, 1, function(url){
doc1=htmlParse(url)
stockprices=getNodeSet(doc1,'//*[@id="optionchain"]/div[5]/table/tbody/tr[1]')
data.frame(sapply(stockprices, function(x){xmlValue(x)}))
}
), fill = TRUE)