因此,我正在编写一个小片段,首先通过正则表达式识别wordpress网站,然后尝试访问登录页面等。
这可以更优化吗?我应该考虑属性之间的空格吗?
Regex wordPressPattern = new Regex("(<meta name=\"generator\" content=\"WordPress)| (Powered by <a href=\"http://www.wordpress.org\")+", RegexOptions.Compiled | RegexOptions.IgnoreCase | RegexOptions.Singleline);
答案 0 :(得分:1)
一些改进:
+
因为没有意义("|')
name=\"generator\"
我认为它不相关,因此我们将使用.*?
并在末尾添加[^>]*>
总结一下:
(<meta.*?content\s*=\s*(\"|')WordPress[^>]*>)|(Powered\s+by\s+<a\s+href\s*=\s*(\"|')http(s)?://(www.)?wordpress.org(\"|'))