是否有可能使用Ruby On Rails创建一个网站,从另一个网站上删除数据并显示它

时间:2011-11-26 16:52:23

标签: ruby-on-rails

我在教自己Ruby on Rails。我想建立网站,每当有人访问它,将刮掉另一个网站并显示一些数据。这可能吗?

4 个答案:

答案 0 :(得分:0)

是的,这是可能的。

记住一件事:不要在控制器操作中抓取数据。爬行数据可能是一个漫长的过程。目标网站可能会很慢或很慢,它会阻止整个网站。您应该使用一些cron作业或作业队列来抓取数据,并将其存储在数据库中。 rails应用程序从数据库获取数据,而不是直接从其他网站获取数据。

答案 1 :(得分:0)

共。您可以使用Nokogiri接收网页内容,解析它,然后在您的网站上显示。从元素的类/ id的角度来看,它需要您对网站的一些了解。

Nokogiri gem

答案 2 :(得分:0)

是。您应该使用Nokogiri或正则表达式来提取您想要的数据,然后显示它。

答案 3 :(得分:0)

这是一个让你前往的小代码示例

require 'open-uri'
open('http://www.stackoverflow.com'){ |f| puts f.read }

这将在您的终端窗口中打印来自此站点的HTML,如果您还没有这样做,请使用实用程序irb查看它是否正常工作,最后这是剥离大部分内容的基本方法HTML,如果你需要..

include ActionView::Helpers::SanitizeHelper
open('http://www.stackoverflow.com'){ |f| puts strip_tags(f.read) }