Rvest Web Scraping仅带有列名称的空数据表

时间:2016-11-21 15:37:22

标签: html r xpath web-scraping rvest

我一直试图利用股票市场来榨取股票市场" rvest"来自此网址的广告订单:http://finans.mynet.com/borsa/canliborsa/#A,需要注册。我创建了虚拟帐户供您尝试。下面的用户名和密码是真实的,工作正常。 我想出的是以下内容:

library("rvest")
library("data.table")

url<- "http://uyeler.mynet.com/login/login.asp?rurl=http%3A%2F%2Ffinans.mynet.com%2Fborsa%2Fcanliborsa%2F&formname=finans#A"
session<-html_session(url)
form<- html_form(session)[[1]]

login<- set_values(form, "username" ="muharrem_babaogul_1991","password"="q1w2e3")
submit_form(session,login)

jumped<-jump_to(session,url = 'http://finans.mynet.com/borsa/canliborsa/#A')

page<- read_html(jumped)
page<-html_nodes(page,xpath='//*[@id="canliLeftColumn"]/div[3]/table')
page<-  html_table(page)
head(page[[1]])

结果:

[1] Hisse         Hisse         Hisse         Son           Alış         
[6] Satış         %Fark         En Düşük      En Yüksek     AOF          
[11] Hacim (Lot)   Hacim (TL)    Son İşlem     Ekle / Kaldır
<0 rows> (or 0-length row.names)

正如您所看到的,我可以使用xpath访问表,我获取列名但内部没有任何数据。表格完全是空的。 有人可以提供帮助吗? 提前谢谢。

1 个答案:

答案 0 :(得分:2)

问题解决了。谢谢你的帮助@ Dave2e。我发现jump_to函数可以抓取数据并将其包含在$ response中。下面的代码将数据表示为txt,仅将其保留。

cellForRow