试图找到一个用于Tumblr的正则表达式

时间:2014-10-25 16:04:29

标签: ruby regex tumblr

我正在尝试找到一个能够在ruby中获取完整tumblr链接的正则表达式。

我一直在使用这个正则表达式用于flickr,foursquare和其他一些网站,因为它很容易让我抓住它周围的所有文字。

/(?:WWW)(:HTTPS //?)?flickr.com/ \ S + /克;

但Tumblr,鉴于.tumblr之前的用户/博客名称让我感到茫然,显然不允许我使用它。

http://heywatchthismovie.tumblr.com/

会喜欢任何关于该怎么做的建议。

1 个答案:

答案 0 :(得分:0)

\w+上的模式匹配,以查找子域。

> s= 'blah blah http://heywatchthismovie.tumblr.com/ blah blah'
=> "blah blah http://heywatchthismovie.tumblr.com/ blah blah"
> s =~ %r{(?:https?://)?(?:\w+.)?tumblr.com/}
=> 10