模式匹配按字母顺序字符串 - Python正则表达式

时间:2015-02-20 22:11:14

标签: python regex alphabetical

我在python中的正则表达式如下:

r'(?s)(\\thinhline\n\\\\\[-16pt]\n)([^\W\d])(.*?)(\n *\\\\)'

我的测试字符串:

\thinhline
\\[-16pt]
Jacobi
  & $\JacobiP{\alpha}{\beta}{n}@{x}$
  & $(-1,1)$
  & $(1 - x)^{\alpha} (1 + x)^{\beta}$
  & $\begin{cases} \ifrac{2^{\alpha+\beta+1}\EulerGamma@{\alpha+1}\EulerGamma@{\beta+1}}{\EulerGamma@{\alpha+\beta+2}}, &\text{$n = 0$} \end{cases}$
    $\begin{cases} \ifrac{2^{\alpha+\beta+1}\EulerGamma@{\alpha+1}\EulerGamma@{\beta+1}}{\EulerGamma@{\alpha+\beta+2}}, & \text{$n = 0$}\end{cases}$
  & $\dfrac{\pochhammer{n+\alpha+\beta+1}{n}}{2^n n!}$
  & $\dfrac{n (\alpha-\beta)}{2n+\alpha+\beta}$
  & $\alpha,\beta > -1$
\\

匹配捕获:

Match 1
1.  \thinhline \\[-16pt]
2.  J
3.  acobi & $\JacobiP{\alpha}{\beta}{n}@{x}$ & $(-1,1)$ & $(1 - x)^{\alpha} (1 + x)^{\beta}$ & $\begin{cases} \ifrac{2^{\alpha+\beta+1}\EulerGamma@{\alpha+1}\EulerGamma@{\beta+1}}{\EulerGamma@{\alpha+\beta+2}}, &\text{$n = 0$} \end{cases}$ $\begin{cases} \ifrac{2^{\alpha+\beta+1}\EulerGamma@{\alpha+1}\EulerGamma@{\beta+1}}{\EulerGamma@{\alpha+\beta+2}}, & \text{$n = 0$}\end{cases}$ & $\dfrac{\pochhammer{n+\alpha+\beta+1}{n}}{2^n n!}$ & $\dfrac{n (\alpha-\beta)}{2n+\alpha+\beta}$ & $\alpha,\beta > -1$
4.  \\

为什么第2组只获得“J”的第一个字符?如何让第2组获得“Jacobi”这个词的全部内容?

1 个答案:

答案 0 :(得分:2)

您需要在角色类中使用quantifier

([^\W\d]+)
        ^
        |________ means match the preceding "one or more" times.

虽然这可能会解决问题,但我会使用以下内容仅匹配字母字符。

([a-zA-Z]+)

注意:您的原始字符类与字母字符和下划线匹配,因此如果您需要匹配下划线字符,您只需将其添加到类中即可。