我正在尝试根据从RSS中提取的链接来解析路透社的新闻内容。
但是,我从RSS获得的链接会将我重定向到另一个实际存储内容的页面。
我是否知道如何根据从RSS中提取的链接解析新闻内容?
我尝试了以下内容:
library(RCurl)
library(XML)
library(httr)
xml.url <- "http://feeds.reuters.com/news/economy"
script <- getURL(xml.url)
doc <- xmlParse(script)
links <- xpathSApply(doc,'//item/link',xmlValue)
script <- getURL(links[1])
获得的“脚本”仅包含重定向链接。因此,我尝试提取重定向链接以转到新闻页面。
redirect <- xmlParse(script)
redirect.link <- xpathSApply(redirect,"//A/@HREF")
script1 <- getURL(redirect.link)
但重定向链接中的getURL会返回一个空字符串。