我正在尝试找到一个能够在ruby中获取完整tumblr链接的正则表达式。
我一直在使用这个正则表达式用于flickr,foursquare和其他一些网站,因为它很容易让我抓住它周围的所有文字。
/(?:WWW)(:HTTPS //?)?flickr.com/ \ S + /克;
但Tumblr,鉴于.tumblr之前的用户/博客名称让我感到茫然,显然不允许我使用它。
http://heywatchthismovie.tumblr.com/
会喜欢任何关于该怎么做的建议。
答案 0 :(得分:0)
\w+
上的模式匹配,以查找子域。
> s= 'blah blah http://heywatchthismovie.tumblr.com/ blah blah'
=> "blah blah http://heywatchthismovie.tumblr.com/ blah blah"
> s =~ %r{(?:https?://)?(?:\w+.)?tumblr.com/}
=> 10