我一直在抓取网站并检索有关它们的图像信息。
但是,如果图片src中不包含该网站,我需要有http://
或http://www.
或subdomain
网站。
轨道中有快速功能吗?
答案 0 :(得分:1)
您应该尝试查看Ruby本身及其string documentation,例如start_with?检查字符串是否以输入开头,您可以使用以下内容:
domain = "http://domain.com/"
image = "image.jpg"
unless image.start_with?(domain)
domain << image.url
end
您应该能够想出一种方法来迭代所有已裁剪的图像并进行更新。
答案 1 :(得分:1)
或者,如果字符串比较没有捕获所有内容,则可以使用Ruby的URI模块。
require 'uri'
只是图片:
# let image.url = "image.jpg"
uri = URI.parse(image.url)
uri.scheme
#=> nil
uri.host
#=> nil
没有http方案:
# let image.url = "domain.com/image.jpg"
uri = URI.parse(image.url)
uri.scheme
#=> "http"
uri.host
#=> nil
随时随地:
# let image.url = "http://domain.com/image.jpg"
uri = URI.parse(image.url)
uri.scheme
#=> "http"
uri.host
#=> "domain.com"
通过选中uri.host
和uri.scheme
,您可以根据需要添加添加。