毫无疑问,我解决了我的特殊问题。我对正则表达的了解很少。我正在使用Regex Class在Java中构建表达式解析器。我想从表达式中提取操作数,参数,运算符,符号和函数名称,然后保存到ArrayList。目前我正在使用这个逻辑
String string = "2!+atan2(3+9,2+3)-2*PI+3/3-9-12%3*sin(9-9)+(2+6/2)" //This is just for testing purpose later on it will be provided by user
List<String> res = new ArrayList<>();
Pattern pattern = Pattern.compile((\\Q^\\E|\\Q/\\E|\\Q-\\E|\\Q-\\E|\\Q+\\E|\\Q*\\E|\\Q)\\E|\\Q)\\E|\\Q(\\E|\\Q(\\E|\\Q%\\E|\\Q!\\E)) //This string was build in a function where operator names were provided. Its mean that user can add custom operators and custom functions
Matcher m = pattern.matcher(string);
int pos = 0;
while (m.find())
{
if (pos != m.start())
{
res.add(string.substring(pos, m.start()))
}
res.add(m.group())
pos = m.end();
}
if (pos != string.length())
{
addToTokens(res, string.substring(pos));
}
for(String s : res)
{
System.out.println(s);
}
输出:
2
!
+
atan2
(
3
+
9
,
2
+
3
)
-
2
*
PI
+
3
/
3
-
9
-
12
%
3
*
sin
(
9
-
9
)
+
(
2
+
6
/
2
)
问题是现在Expression可以包含具有用户定义格式的Matrix。我希望在函数的情况下将每个Matrix视为操作数或参数。
输入1:
String input_1 = "2+3-9*[{2+3,2,6},{7,2+3,2+3i}]+9*6"
输出应该是:
2
+
3
-
9
*
[{2+3,2,6},{7,2+3,2+3i}]
+
9
*
6
输入2:
String input_2 = "{[2,5][9/8,func(2+3)]}+9*8/5"
输出应该是:
{[2,5][9/8,func(2+3)]}
+
9
*
8
/
5
输入3:
String input_3 = "<[2,9,2.36][2,3,2!]>*<[2,3,9][23+9*8/8,2,3]>"
输出应该是:
<[2,9,2.36][2,3,2!]>
*
<[2,3,9][23+9*8/8,2,3]>
我希望现在ArrayList应该包含每个索引处的每个操作数,运算符,参数,函数和符号。如何使用正则表达式实现所需的输出。不需要表达式验证。
答案 0 :(得分:3)
我认为您可以尝试使用以下内容:
(?<matrix>(?:\[[^\]]+\])|(?:<[^>]+>)|(?:\{[^\}]+\}))|(?<function>\w+(?=\())|(\d+[eE][-+]\d+)|(?<operand>\w+)|(?<operator>[-+\/*%])|(?<symbol>.)
元素在命名捕获组中捕获。如果您不需要,可以使用短片:
\[[^\]]+\]|<[^>]+>|\{[^\}]+\}|\d+[eE][-+]\d+|\w+(?=\()|\w+|[-+\/*%]|.
\[[^\]]+\]|<[^>]+>|\{[^\}]+\}
匹配左括号({
,[
或<
),非拼写括号字符和右括号(}
,]
, >
)所以如果没有嵌套的相同类型括号,则没有问题。
Java中的实现:
public class Test {
public static void main(String[] args) {
String[] expressions = {"2!+atan2(3+9,2+3)-2*PI+3/3-9-12%3*sin(9-9)+(2+6/2)", "2+3-9*[{2+3,2,6},{7,2+3,2+3i}]+9*6",
"{[2,5][9/8,func(2+3)]}+9*8/5","<[2,9,2.36][2,3,2!]>*<[2,3,9][23 + 9 * 8 / 8, 2, 3]>"};
Pattern pattern = Pattern.compile("(?<matrix>(?:\\[[^]]+])|(?:<[^>]+>)|(?:\\{[^}]+}))|(?<function>\\w+(?=\\())|(?<operand>\\w+)|(?<operator>[-+/*%])|(?<symbol>.)");
for(String expression : expressions) {
List<String> elements = new ArrayList<String>();
Matcher matcher = pattern.matcher(expression);
while (matcher.find()) {
elements.add(matcher.group());
}
for (String element : elements) {
System.out.println(element);
}
System.out.println("\n\n\n");
}
}
}
替代方案的说明:
\[[^\]]+\]|<[^>]+>|\{[^\}]+\}
- 匹配给定的左括号
类型,字符不是该类型的括号
(一切都不是关闭括号),并且关闭括号
型,\d+[eE][-+]\d+
=数字,然后是e
或E
,后跟运营商+
或-
,后跟数字,以捕获2e+3
\w+(?=\()
- 匹配一个或多个字词(A-Za-z0-9_)
(如果是)
其后是(
,用于匹配sin
,\w+
- 匹配一个或多个单词字符(A-Za-z0-9_)
进行匹配
操作数,[-+\/*%]
- 匹配字符类中的一个字符以匹配
运营商.
- 匹配任何其他字符,以匹配其他符号备选方案的顺序非常重要,因为最后一个替代.
将匹配任何字符,因此它需要是最后一个选项。类似\w+(?=\()
和\w+
的情况,第二个会匹配前一个,但是如果你不想区分函数和操作数,那么\w+
就足够了对于他们所有人。
在更长的例子中,每个备选项中的(?<name> ... )
部分都是一个命名的捕获组,您可以在演示中看到它如何在gorup中匹配片段,如:操作数,运算符,函数等。
答案 1 :(得分:2)
使用正则表达式,无法匹配任何级别的嵌套平衡括号。
例如,在您的第二个示例{[2,5][9/8,func(2+3)]}
中,您需要将左大括号与近大括号匹配,但您需要跟踪有多少打开和关闭内括号/ parens /等。用正则表达式无法做到这一点。
另一方面,如果您简化问题以消除任何平衡要求,那么您可能可以处理正则表达式。