我有一个项目来搜索1400多个经典的asp网站,搜索我们传递用户名和密码的所有地方。在这样做时,我需要检索所有包含,因为大多数逻辑都在包含中。我已经构建了一个代码爬虫,但我很难想出一个简单的正则表达式来返回给定文件中的所有包含。
模式是这样的:
<!--#include file="includes/headers.inc"-->
请有人帮我解决这个问题。我需要能够匹配这种模式的东西并返回
之间的所有内容非常感谢任何帮助。
答案 0 :(得分:2)
var includes = new List<string>();
var regex = new Regex("#include\\W+file=\"([^\"]+)\"");
var matchResult = regex.Match(fileContent);
while (matchResult.Success) {
includes.Add(matchResult.Groups[1].Value);
matchResult = matchResult.NextMatch();
}