我在R中进行网页报废时出现问题。我正在执行以下示例,但没有获取值而是获取list(),其中包含零元素
library(XML)
url<-"http://scholar.google.com/citations?user=HI-I6C0AAAAJ"
parsedhtml<-htmlTreeParse(url,useInternalNodes=T)
xpathSApply(parsedhtml,"//td[@id='col-citedby']",xmlValue)
我计算以下代码后得到list()
答案 0 :(得分:2)
您的xpath很可能不正确。如果您只想要引用列表,请尝试:
library(XML)
url<-"http://scholar.google.com/citations?user=HI-I6C0AAAAJ"
parsedhtml<-htmlParse(url)
parsedhtml["//a[@class='gsc_a_ac']", fun = xmlValue]
答案 1 :(得分:0)
try this:
library(httr)
url<-"http://scholar.google.com/citations?user=HI-I6C0AAAAJ"
page<-GET(url)
parsedhtml<-htmlParse(page,useInternalNodes=T)
xpathSApply(parsedhtml,"//td[@id='col-citedby']",xmlValue)