我正在使用R来抓取此链接中的链接标题www.jamesaltucher.com/sitemap.xml
这是我的代码。
library(XML)
library(RCurl)
url.link <- 'http://www.jamesaltucher.com/sitemap.xml'
blog <- getURL(url.link)
blog <- htmlParse(blog, encoding = "UTF-8")
titles <- xpathSApply (blog ,"//a",xmlValue) ## titles
我的titles
是一个空列表。
见截图:
我是否错误地使用了xpath?
答案 0 :(得分:1)
是。您正在寻找loc
元素,而不是a
元素。
titles <- xpathSApply (html ,"//loc",xmlValue)