从字符串C ++ PCRE中提取Math表达式

时间:2016-12-16 14:17:57

标签: c++ regex

我需要从字符串中提取表达式。

输入字符串

N100$VAR1=100+$Var2*30 + #29X=30.99Z=(#991+ ( 30*SIN(60) + $VAR32 ) / #32)

预期输出

$VAR1=100+$Var2*30 + #29
X=30.99
Z=(#991+ ( 30*SIN(60) + $VAR32 ) / #32)

我尝试了以下

(\$*[A-Z][A-Z\d\_]+)\s*=\s*([\S]*)\s*([\+\-\/\*]\s*(\$*[A-Z0-9\.\_\)]+)\s*)

当字符串中没有空格时,这是有效的 我希望它也适用于空白区域。

TIA。

1 个答案:

答案 0 :(得分:1)

您可以使用与=之前的变量匹配的正则表达式,然后使用直到第一次出现变量+ =模式的任何文本:

(\$*[A-Z][A-Z\d_]*)\s*=\s*((?:(?![A-Z]\d+\.\d+|[A-Z][A-Z\d_]*\s*=).)*)

请参阅regex demo

<强>详情:

  • (\$*[A-Z][A-Z\d_]*) - 第1组:
    • \$* - 0 + $个符号
    • [A-Z] - 一个大写的ASCII字母
    • [A-Z\d_]* - 0+大写ASCII字母,数字或_
  • \s*=\s* - 包含0 +空格的=
  • ((?:(?![A-Z]\d+\.\d+|[A-Z][A-Z\d_]*\s*=).)*) - 第2组:
    • (?:(?![A-Z]\d+\.\d+|[A-Z][A-Z\d_]*\s*=).)* - 0+序列:
      • (?![A-Z]\d+\.\d+) - 下一个字符不能是序列的起始字符:大写ASCII字母,1 +位数,.和1+位数
      • (?![A-Z][A-Z\d_]*\s*=) - 下一个字符不能是序列的起始字符:大写ASCII字母,0 +大写ASCII字母/数字/ _,0 +空格,=
      • . - 除了换行符之外的字符

请参阅C++ demo

#include <string>
#include <iostream>
#include <regex>
using namespace std;

int main() {
    std::regex r(R"((\$*[A-Z][A-Z\d_]*)\s*=\s*((?:(?![A-Z]\d+\.\d+|[A-Z][A-Z\d_]*\s*=).)*))");
    std::string s = "N100$VAR1=100+$Var2*30 + #29X=30.99Z=(#991+ ( 30*SIN(60) + $VAR32 ) / #32)";
    for(std::sregex_iterator i = std::sregex_iterator(s.begin(), s.end(), r);
                             i != std::sregex_iterator();
                             ++i)
    {
        std::smatch m = *i;
        std::cout << "Match value: " << m.str()      << '\n';
        std::cout << "    Capture: " << m[1].str()   << '\n';
        std::cout << "    Capture: " << m[2].str()   << '\n';
    }
    return 0;
}

输出:

Match value: $VAR1=100+$Var2*30 + #29
    Capture: $VAR1
    Capture: 100+$Var2*30 + #29
Match value: X=30.99
    Capture: X
    Capture: 30.99
Match value: Z=(#991+ ( 30*SIN(60) + $VAR32 ) / #32)
    Capture: Z
    Capture: (#991+ ( 30*SIN(60) + $VAR32 ) / #32)