从外部URL下载内容并使用Ruby保存在db中

时间:2010-08-21 18:11:47

标签: ruby web-services

这不是网络服务。我想将一个url传递给控制器​​,然后让它从该页面获取html。然后将信息存储在数据库中。

你怎么看?我怎么能做到这一点?

3 个答案:

答案 0 :(得分:1)

是 提示:http://en.wikibooks.org/wiki/Ruby_Programming/Standard_Library/OpenURI

然后使用一些ORM或直接使用mysql驱动程序。

答案 1 :(得分:1)

当我阅读你的帖子时,我想到的第一件事是Watir @ http://watir.com/

  

Watir是一个Ruby库系列   但无论如何它都支持你的应用程序   它开发的技术是什么。   他们支持Internet Explorer   Windows,Windows上的Firefox,Mac和   Linux,Mac上的Safari,Chrome上的   用Windows进行Windows和Flash测试   Firefox浏览器。

     

与其他编程语言一样,Ruby   为您提供连接的能力   数据库,读取数据文件和   电子表格,导出XML和   将代码构造为可重用的   库。与其他编程不同   语言,Ruby简洁而且经常是   读书的快乐。

您可以轻松抓取HTML,然后将其填充到数据库,excel等。

答案 2 :(得分:1)

在您的控制器中:

html = %x[curl #{params[:url]}]

这将执行system curl命令并将结果(这是从url中提取的内容)保存在变量html中。然后你可以根据需要制作带有该字符串的热蛋糕。