我一直试图从一个足球网站上搜集一个球员桌面以及个人球员个人资料的链接。我使用Chrome的Inspect element
来获取xpath(这是一个好主意吗?),但我仍然没有结果。
网页为Liverpool's page。下面是我试图刮掉玩家表和每个玩家个人资料的链接。
require(XML)
team_name <- "Liverpool"
url <- paste("http://www.football-lineups.com/team/", team_name,
"/Champions_League_2004_2005/Stats/Most_Capped/", sep='')
url.data <- htmlParse(url)
table <- xpathApply(url.data,
'//*[@id="mainarea"]/tbody/tr/td[1]/table[2]', xmlValue)
links <- xpathApply(url.data,
'//*[@id="mainarea"]/tbody/tr/td[1]/table[2]/tbody/tr[2]/td[2]/a/@href', xmlValue)
table #NULL
links #NULL
编辑:然而,废弃网页上的所有链接。我必须在上面做错事!
links2 <- xpathSApply(url.data, "//a/@href")
links2 # a bunch of links