网页抓取:如何处理RSS提要

时间:2016-12-10 17:01:23

标签: r web-scraping

我正在开发一个项目,需要检索craigslist列表并将它们保存为结构化表格格式。虽然没有可用的API,但网址http://boston.craigslist.org/search/hhh?format=rss&query=apartments会返回我需要的一些内容。从该网页读取内容并将其保存到带有标题,链接和描述列的表中的最佳方法是什么?我尝试了下面的代码,但它返回了一条错误消息。

library(rvest)
url <- "http://boston.craigslist.org/search/hhh?format=rss&query=apartments"
read_html(url)

#error msg
Error in UseMethod("read_xml") : 
  no applicable method for 'read_xml' applied to an object of class "function"

由于

0 个答案:

没有答案