我目前正在HTML页面中搜索特定链接,目前我有一个正则表达式,如下所示,它会选择一个通用URI:
Regex regex = new Regex(@"(https?|ftp|file)\://[A-Za-z0-9\.\-]+(/[A-Za-z0-9\?\&\=;\+!'\(\)\*\-\._~%]*)*");
虽然HTML中有几个链接,所以它会选出第一个链接,其中我要提取的链接如下:
http://*.*.com/dlp/*/*/*
如何使用正则表达式实现这一目标?
答案 0 :(得分:1)
试试这个:
http\://[A-Za-z0-9\.\-]+\.com/dlp[A-Za-z0-9\.\-/]*
您可能需要再次转义某些字符。