我有当前的正则表达式exp:
http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+
从文件中检索所有网址,但我只需要它来获取具有特定页面的网址,比如说 page-to-find ,我似乎无法做到这一点可以将表达式添加到第二个组中,而我只希望它本机地在一个组中而不是在两个组中尽可能地直接。
有什么提示吗?
谢谢
答案 0 :(得分:1)
如果它的页面以什么结尾? .asp? .php? .aspx? .htm? .html? (还有什么?)
尝试一下:
http[s]?://.*page-to-find