我正在尝试编写正则表达式以包含URL中包含关键字的所有网页,并排除在子文件夹中具有相同关键字的网页。
我正在使用它的工具是一个网站审核工具。
范围:
domain.com
包括:
\<this-keyword\>
排除:
^/this-keyword/.*
它一直告诉我没有“种子网址”。任何帮助将不胜感激。
答案 0 :(得分:0)
使用双斜杠//
识别网址部分:
(?!\/\/[^\/\n]*\bthis-keyword\b[^\/\n]*\/.*?this-keyword)\/\/[^\/\n]*\bthis-keyword\b