Question

我正试图熟悉regexp。尽管如此，我仍然遇到一些问题。我只想提取以下网址：

regularexpression = '';       
script = ['I <I>used</I> <B>to</B> visit <THE> website <A HREF=www.lichess.org>twice a day</A>. ' ...
'Visit <I>the website</I> <A HREF=www.bing.com>or alternatively</A> just <A HREF=www.google.com> for more information</A>.']
x = regexp(script,regularexpression,'match')

这应该提供一个1X3的单元格数组{'www.lichess.org'} {'www.bing.com'} {'www.google.com'}

Answer 1

regularexpression = 'www\.[^>]*'; 
script = ['I <I>used</I> <B>to</B> visit <THE> website <A HREF=www.lichess.org>twice a day</A>. ' ...
'Visit <I>the website</I> <A HREF=www.bing.com>or alternatively</A> just <A HREF=www.google.com> for more information</A>.']
x = regexp(script,regularexpression,'match')

输出：

  1×3 cell array

    {'www.lichess.org'}    {'www.bing.com'}    {'www.google.com'}

在Matlab正则表达式中提取URL

1 个答案: