在R中使用xpathSApply。空列表是输出而不是值

时间:2014-12-27 05:57:43

标签: r

我在R中进行网页报废时出现问题。我正在执行以下示例,但没有获取值而是获取list(),其中包含零元素

library(XML)

url<-"http://scholar.google.com/citations?user=HI-I6C0AAAAJ"

parsedhtml<-htmlTreeParse(url,useInternalNodes=T)

xpathSApply(parsedhtml,"//td[@id='col-citedby']",xmlValue)

我计算以下代码后得到list()

2 个答案:

答案 0 :(得分:2)

您的xpath很可能不正确。如果您只想要引用列表,请尝试:

library(XML)
url<-"http://scholar.google.com/citations?user=HI-I6C0AAAAJ"
parsedhtml<-htmlParse(url)
parsedhtml["//a[@class='gsc_a_ac']", fun = xmlValue]

答案 1 :(得分:0)

try this:

    library(httr)
    url<-"http://scholar.google.com/citations?user=HI-I6C0AAAAJ"
    page<-GET(url)
parsedhtml<-htmlParse(page,useInternalNodes=T)
xpathSApply(parsedhtml,"//td[@id='col-citedby']",xmlValue)