我需要从一组文本信息中提取http链接。具有图像扩展的特定短语(.jpg,.png)
例如,我一个人想要" http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg"
来自以下的东西
<p><a href="http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg" target="_blank"><a href="http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg">http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg</a></a> (from <a href="http://cameroningalls.com/emily-meeko-tiburon/" target="_blank">this wedding by Cameron Ingalls</a>)</p>
如果那些是img标签,我可以从简单的appraoch
获得它String s="<img src="http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg"/>
s=s.replace("<img src=", "");
s=s.replace("/>", "");
但是我很难通过第一个场景,对它有任何建议吗?
答案 0 :(得分:2)
您可以使用正则表达式来匹配它。
(https?://)?([\ da-z.-] +)。([az。] {2,6})([/ \ w .-] )
如果您需要知道如何使用它并了解正则表达式,请使用提供的链接darkpbj。相当强大的东西。
祝你好运。答案 1 :(得分:1)
您是否已将原始信息放在一个字符串中?这看起来像是正则表达式的经典作业。我会查看这个网站,
9:HTML标签正则表达式模式 http://www.mkyong.com/regular-expressions/10-java-regular-expression-examples-you-should-know/
这里有一个很好的解释如何使用它: http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/