Ruby on Rails:从博客站点收集数据

时间:2017-03-04 00:40:47

标签: ruby-on-rails ruby

这是一个非常广泛的问题,请耐心等待。

我想创建一个从其他网站获取数据的应用,特别是medium.com。但是,我不认为媒体有API。

具体来说,我想要实现的是在medium.com上搜索有500个或更多喜欢的文章,或者可能有一个有50个或更多回复的文章(评论)。我想用ruby来做 你觉得我怎么能这样做?如果你知道怎么做,请指出正确的方向。提前谢谢你:)

2 个答案:

答案 0 :(得分:1)

目前,没有API来获取所有POSTS,也没有搜索它们,请参阅https://github.com/Medium/medium-api-docs/issues/48

答案 1 :(得分:1)

我建议使用名为nokogiri的红宝石宝石进行webscraping 它是获取几乎可用于任何网站的数据的通用方式。

看看这些链接开始:-)
Web Scraping with Ruby and Nokogiri for Beginners
个人最喜欢的 Parsing HTML with Nokogiri