我有一个非常冗余的配置文件格式..我发明了一种用于编写循环的自定义脚本格式,例如:
[Config Object]
{Loop 3
Setting[i] = Value[i]
}
OtherSetting=X
这将导致:
[Config Object]
Setting1 = Value1
Setting2 = Value2
Setting3 = Value3
OtherSetting = X
我的第一个想法是使用正则表达式,如下所示:
!{(.*?)}!is
在我尝试将它与嵌套循环一起使用之前,这确实很有效 - 你肯定知道这个“哦cr ......时刻”
因为以下内容:
1: [Config Object]
2: *{*Loop 3
3: Section[i]
4: {Loop 3
5: Setting[i] = Value[i]
6: *}*
7: }
8: OtherSetting=X
将引导正则表达式覆盖第2行和第6行之间的范围(用* s推销它们)
实际上我真的不知道如何解决这个问题,因为正则表达式在逻辑上是正确的。
?需要Lazy-Operator,因为没有它我会在另一个方向遇到同样的问题,并且无法编写两个跟随循环。
有点研究让我清楚,正则表达式不是正确的方向, 但我找不到任何PHP解决方案。 那么我怎么能在PHP中按性能解析我的“循环”-script,例如一个带有循环的数组,并用计算结果替换大括号内的命令?
答案 0 :(得分:3)
评论中提到了正确的解决方案。您需要实际编写编译器/解析器。从我的编译器课程来看,我的记忆有点模糊,但这就是你如何接近它。
基本概念是将输入转换为标记(这是正则表达式正常的地方)。这称为词法分析
所以:
[Config Object]
{Loop 3
Section[i]
{Loop 3
Setting[i] = Value[i]
}
}
OtherSetting=X
成为(伪代码令牌,可能不是您需要的)
OPEN_BRACKET STRING(=Config Object) CLOSE_BRACKET
START_LOOP NUMBER(=3)
STRING(=Section) OPEN_BRACKET STRING(=i) CLOSE_BRACKET
START_LOOP NUMBER(=3)
STRING(=Setting) OPEN_BRACKET STRING(=i) CLOSE_BRACKET EQUAL STRING(=Value) OPEN_BRACKET STRING(=i) CLOSE_BRACKET
END_LOOP
END_LOOP
STRING(=OtherSetting) EQUAL STRING(=X)
因此,如果你的词法分析器为你提供了如上所述的一系列令牌,你只需解析它就可以实现语法(所以这就是你没有的地方想要使用正则表达式。)
你的语法(对于循环)是沿着这些方向的东西(伪代码语法有点像Bison,我可能忘记了部分/故意留下的东西):
INDEXED_CONFIG_LINES: INDEXED_CONFIG_LINE | INDEXED_CONFIG_LINES INDEXED_CONFIG_LINE;
INDEXED_CONFIG_LINE: STRING OPEN_BRACKET STRING CLOSE_BRACKET EQUAL STRING OPEN_BRACKET STRING CLOSE_BRACKET;
LOOP: START_LOOP NUMBER LOOP_BODY END_LOOP;
LOOP_BODY: INDEXED_CONFIG_LINES | LOOP;
因此,您需要一个可以使用该语法构建语法树的解析器,而不是正则表达式。你基本上只是构建一个状态机,在那里你将下一个令牌转换到某个状态(比如循环体等)。
老实说,YAML可能会满足您的需求,而不是重新发明轮子或使用正则表达式体操。但是如果你真的需要使用你提出的循环语法,你可以看一下Symfony Yaml组件,看看它们是如何进行解析的。 https://github.com/symfony/Yaml
或者你可以看看Twig有另一个有循环的解析器:https://github.com/fabpot/Twig/tree/master/lib/Twig
答案 1 :(得分:0)
我发现当我拥有一大堆相关的变量时(就像你看到的那样),数组是可行的方法。然后你可以跳过递归和解析。例如:
$cars=array("A","B","C");
echo $cars[0]; // echos "A"
不要因为建议而敲我,但是你不能在配置文件中使用数组?它也很容易解析...