正则表达式匹配LaTeX方程

时间:2013-01-06 14:05:25

标签: regex latex

我正在尝试将TeXWorks编辑器配置为使用与TeXMaker相同的语法着色。但是,TexWorks使用正则表达式来指定应着色的内容。不幸的是,它没有数学的默认设置。

我希望匹配$$之间的所有内容, \[\]之间的所有内容, \(\)之间的所有内容, $$$$之间的所有内容。后者不是很必要,因为它在LaTeX文档中很少使用。

它也可以是多个正则表达式来匹配所有情况。

当然\$已转义,因此我不想与之匹配,也不想\\[等。

然后我还希望匹配\begin{equation}\end{equation}之间的所有内容,但这很简单。

'无法做到'是一个可能的答案。

1 个答案:

答案 0 :(得分:8)

试试这个PCRE正则表达式:

(?<!\\)    # negative look-behind to make sure start is not escaped 
(?:        # start non-capture group for all possible match starts
  # group 1, match dollar signs only 
  # single or double dollar sign enforced by look-arounds
  ((?<!\$)\${1,2}(?!\$))|
  # group 2, match escaped parenthesis
  (\\\()|
  # group 3, match escaped bracket
  (\\\[)|                 
  # group 4, match begin equation
  (\\begin\{equation\})
)
# if group 1 was start
(?(1)
  # non greedy match everything in between
  # group 1 matches do not support recursion
  (.*?)(?<!\\)
  # match ending double or single dollar signs
  (?<!\$)\1(?!\$)|  
# else
(?:
  # greedily and recursively match everything in between
  # groups 2, 3 and 4 support recursion
  (.*(?R)?.*)(?<!\\)
  (?:
    # if group 2 was start, escaped parenthesis is end
    (?(2)\\\)|  
    # if group 3 was start, escaped bracket is end
    (?(3)\\\]|     
    # else group 4 was start, match end equation
    \\end\{equation\}
  )
))))

请参阅此正则表达式:https://regex101.com/r/wP2aV6/25

由于此正则表达式使用递归,因此它将正确处理嵌套的数学表达式。

这仅适用于PCRE兼容的正则表达式引擎。它需要一些正则表达式引擎的高级功能,如负面的后观,条件表达式和递归,这些都不在所有正则表达式引擎中。

除非你需要一些非常简单的东西,否则我建议不要使用这个正则表达式,而是使用适当的LaTeX解析器。