我想解析一个文件,该文件是类似于此示例的环境变量列表:
TPS_LIB_DIR = "$DEF_VERSION_DIR\lib\ver215";
TPS_PH_DIR = "$DEF_VERSION_DIR";
TPS_SCHEMA_DIR = "~TPS_DIR\Supersedes\code;" +
"~TPR_DIR\..\Supersedes\code;" +
"~TPN_DIR\..\..\Supersedes\code;" +
"$TPS_VERSION_DIR";
TPS_LIB_DIR = "C:\prog\lib";
BASE_DIR = "C:\prog\base";
SPARS_DIR = "C:\prog\spars";
SIGNALFILE_DIR = "E:\SIGNAL_FILES";
SIGNALFILE2_DIR = "E:\SIGNAL_FILES2";
SIGNALFILE3_DIR = "E:\SIGNAL_FILES2";
我想出了一个与单行定义匹配的正则表达式,但是与多行定义不匹配。
(\w+)\s*=\s*(.*);[\r\n]+
有人知道一个正则表达式将解析此文件中环境变量名称在组1中且值(在=右侧)在组2中的所有行吗?更好的是,如果多个路径位于不同的组中,但是我可以手动处理该部分。
更新:
这就是我最终实现的目标。第一个模式“模式p”与各个环境变量块匹配。第二种模式“模式valpattern”为每个环境变量解析一个或多个值。希望有人觉得这有用。
private static void parse(File filename) {
Pattern p = Pattern.compile("(\\w+)\\s*=\\s*([\\s\\S]+?\";)");
Pattern valpattern = Pattern.compile("\\s*\"(.+)\"\\s*");
try {
String str = readFile(filename, StandardCharsets.UTF_8);
Matcher matcher = p.matcher(str);
while(matcher.find()) {
String key = matcher.group(1);
Matcher valmatcher = valpattern.matcher(matcher.group(2));
System.out.println(key);
while(valmatcher.find()) {
System.out.println("\t" + valmatcher.group(1).replaceAll(System.getProperty("line.separator"), ""));
}
}
} catch (IOException e) {
System.out.println("Error: ProcessENV.parse -- problem parsing file: " + filename + System.lineSeparator());
e.printStackTrace();
}
}
static String readFile(File file, Charset encoding) throws IOException {
byte[] encoded = Files.readAllBytes(file.toPath());
return new String(encoded, encoding);
}
答案 0 :(得分:2)
将'='和'“;'分开比较容易。
[ c.strip().split(' = ') for c in s.split('";') ]
或者具有双重理解力以获取各个路径:
[ [p[0].strip(), * [x.strip() for x in p.strip().split('=')] for c in s.split('";') for p in c.split(" = ")]
可以用re分割,添加\ s *以删除结尾的空格:
re.split(r'\s*=\s*|";\s*', text, flags=re.MULTILINE):
偶数元素r [:: 2]将是vars,奇数[1 :: 2]值 然后消除值中多余的空格
答案 1 :(得分:1)
您可以使用以下正则表达式:
(\w+)\s*=\s*([\s\S]+?)";
它将首先匹配Word
字符的第1组,零个或多个White Spaces
,匹配equal sign
,零个或多个White Space
,然后匹配第2个或更多组(any
个字符(non greedy
),最后是最后一个quote
和一个semi colon
。
这将匹配所有行。