与Facebook的用户界面类似,我正在尝试从外部链接网站生成预览图像。因此,当用户键入他正在链接的URL时,UI将默认扫描该网站以获取img并刮擦预览拇指。
这种技术有特定的名称吗?或者有人能指出我学习这个的方向吗?
非常感谢!
答案 0 :(得分:3)
它叫做刮刮。有一个名为scrAPI的库。
以下是代码示例http://crunchlife.com/articles/2007/08/13/code-snippet-ruby-image-scraper
答案 1 :(得分:3)
页面抓取有两种不同的选择。另一个要检查的是nokogiri,http://nokogiri.org/。您可以在http://nokogiri.org/tutorials找到有关如何使用它的教程。
为什么不抓住整个页面的图像,而不是从网站抓取图像?您可以使用免费的屏幕截图服务,例如http://www.websnapr.com/或http://www.thumbshots.com/等。在一个应用程序中,我将其用于我的预览图像,并使用nokogiri来抓取页面标题和描述。只是一个想法。