从数学表达式中提取操作数的正则表达式

时间:2015-10-11 20:28:47

标签: java regex parsing mathematical-expressions

毫无疑问,我解决了我的特殊问题。我对正则表达的了解很少。我正在使用Regex Class在Java中构建表达式解析器。我想从表达式中提取操作数,参数,运算符,符号和函数名称,然后保存到ArrayList。目前我正在使用这个逻辑

String string = "2!+atan2(3+9,2+3)-2*PI+3/3-9-12%3*sin(9-9)+(2+6/2)" //This is just for testing purpose later on it will be provided by user
List<String> res = new ArrayList<>();
Pattern pattern = Pattern.compile((\\Q^\\E|\\Q/\\E|\\Q-\\E|\\Q-\\E|\\Q+\\E|\\Q*\\E|\\Q)\\E|\\Q)\\E|\\Q(\\E|\\Q(\\E|\\Q%\\E|\\Q!\\E)) //This string was build in a function where operator names were provided. Its mean that user can add custom operators and custom functions 
Matcher m = pattern.matcher(string);
int pos = 0;
while (m.find()) 
{
    if (pos != m.start()) 
    {
        res.add(string.substring(pos, m.start()))
    }
    res.add(m.group())
    pos = m.end();
}
if (pos != string.length()) 
{
     addToTokens(res, string.substring(pos));
}
for(String s : res)
{
     System.out.println(s);
}

输出:

2
!
+
atan2
(
3
+
9
,
2
+
3
)
-
2
*
PI
+
3
/
3
-
9
-
12
%
3
*
sin
(
9
-
9
)
+
(
2
+
6
/
2
)

问题是现在Expression可以包含具有用户定义格式的Matrix。我希望在函数的情况下将每个Matrix视为操作数或参数。

输入1:

String input_1 = "2+3-9*[{2+3,2,6},{7,2+3,2+3i}]+9*6"

输出应该是:

2
+
3
-
9
*
[{2+3,2,6},{7,2+3,2+3i}]
+
9
*
6

输入2:

String input_2 = "{[2,5][9/8,func(2+3)]}+9*8/5"

输出应该是:

{[2,5][9/8,func(2+3)]}
+
9
*
8
/
5

输入3:

String input_3 = "<[2,9,2.36][2,3,2!]>*<[2,3,9][23+9*8/8,2,3]>"

输出应该是:

<[2,9,2.36][2,3,2!]>
*
<[2,3,9][23+9*8/8,2,3]>

我希望现在ArrayList应该包含每个索引处的每个操作数,运算符,参数,函数和符号。如何使用正则表达式实现所需的输出。不需要表达式验证。

2 个答案:

答案 0 :(得分:3)

我认为您可以尝试使用以下内容:

(?<matrix>(?:\[[^\]]+\])|(?:<[^>]+>)|(?:\{[^\}]+\}))|(?<function>\w+(?=\())|(\d+[eE][-+]\d+)|(?<operand>\w+)|(?<operator>[-+\/*%])|(?<symbol>.)

DEMO

元素在命名捕获组中捕获。如果您不需要,可以使用短片:

\[[^\]]+\]|<[^>]+>|\{[^\}]+\}|\d+[eE][-+]\d+|\w+(?=\()|\w+|[-+\/*%]|.


\[[^\]]+\]|<[^>]+>|\{[^\}]+\}匹配左括号({[<),非拼写括号字符和右括号(}]>)所以如果没有嵌套的相同类型括号,则没有问题。 Java中的实现:

public class Test {
    public static void main(String[] args) {
        String[] expressions = {"2!+atan2(3+9,2+3)-2*PI+3/3-9-12%3*sin(9-9)+(2+6/2)", "2+3-9*[{2+3,2,6},{7,2+3,2+3i}]+9*6",
        "{[2,5][9/8,func(2+3)]}+9*8/5","<[2,9,2.36][2,3,2!]>*<[2,3,9][23 + 9 * 8 / 8, 2, 3]>"};
        Pattern pattern = Pattern.compile("(?<matrix>(?:\\[[^]]+])|(?:<[^>]+>)|(?:\\{[^}]+}))|(?<function>\\w+(?=\\())|(?<operand>\\w+)|(?<operator>[-+/*%])|(?<symbol>.)");
        for(String expression : expressions) {
            List<String> elements = new ArrayList<String>();
            Matcher matcher = pattern.matcher(expression);
            while (matcher.find()) {
                elements.add(matcher.group());
            }
            for (String element : elements) {
                System.out.println(element);
            }
            System.out.println("\n\n\n");
        }
    }
}

替代方案的说明:

  • \[[^\]]+\]|<[^>]+>|\{[^\}]+\} - 匹配给定的左括号 类型,字符不是该类型的括号 (一切都不是关闭括号),并且关闭括号 型,
  • \d+[eE][-+]\d+ =数字,然后是eE,后跟运营商+-,后跟数字,以捕获2e+3
  • 等元素
  • \w+(?=\() - 匹配一个或多个字词(A-Za-z0-9_)(如果是) 其后是(,用于匹配sin
  • 等功能
  • \w+ - 匹配一个或多个单词字符(A-Za-z0-9_)进行匹配 操作数,
  • [-+\/*%] - 匹配字符类中的一个字符以匹配 运营商
  • . - 匹配任何其他字符,以匹配其他符号

备选方案的顺序非常重要,因为最后一个替代.将匹配任何字符,因此它需要是最后一个选项。类似\w+(?=\()\w+的情况,第二个会匹配前一个,但是如果你不想区分函数和操作数,那么\w+就足够了对于他们所有人。

在更长的例子中,每个备选项中的(?<name> ... )部分都是一个命名的捕获组,您可以在演示中看到它如何在gorup中匹配片段,如:操作数,运算符,函数等。

答案 1 :(得分:2)

使用正则表达式,无法匹配任何级别的嵌套平衡括号。

例如,在您的第二个示例{[2,5][9/8,func(2+3)]}中,您需要将左大括号与近大括号匹配,但您需要跟踪有多少打开和关闭内括号/ parens /等。用正则表达式无法做到这一点。

另一方面,如果您简化问题以消除任何平衡要求,那么您可能可以处理正则表达式。