我想在我的Google提醒RSS Feed中删除新闻文章。这是我在R中使用XML包的代码:
install.packages("XML")
library(XML)
doc1<xmlTreeParse("http://www.google.com/alerts/feeds/15985631956668437618/934829089626358614")
file<-xmlRoot(doc1)
src<-xpathApply(file[5]$entry,"\\entry")
这就是我认为问题所在:
xmlRoot()函数创建一个包含24个元素的列表。如果只有1个元素,则xpathApply()函数将能够检测节点,如下例所示:http://www.r-bloggers.com/how-to-build-a-dataset-in-r-using-an-rss-feed-or-web-page/
我正在寻找的新闻文章的网址隐藏在一堆HTML代码中。
如果有人能帮我解决这个问题,或者给出问题的替代方法,我将不胜感激。谢谢。