我有这个/href *= *[\'"]\Khttps?:\/\/(?:www\.)?twitter\.com[^\'"]+/
表达式来提取twitter-urls。它适用于以 www 开头的所有网址,但如果缺少 www 则不行。我需要更改此行,以便使用RegEx获取两个链接(使用和不使用www)?
<a href="//www.twitter.com/anything">LINK1</a>
<a href="//twitter.com/anything">LINK2</a>
感谢您的帮助!
是的,我知道有一些帖子包含该问题并显示了解决方案,但没有一个真正帮助我解决这个问题。
答案 0 :(得分:3)
www
不是问题。如您所见,您的模式包含https?
,您必须将其设为可选:
href *= *[\'"]\K(?:https?:)?\/\/(?:www\.)?twitter\.com[^\'"]+
请参阅demo。