使用REGEX模式识别TOC条目

时间:2013-10-02 14:50:42

标签: regex

我在正则表达式领域相对较新: 我需要一些帮助来确定以下模式:

1. Scope  . . . . . . . . . . . . . . . . . . . . . . .  . . .  4
2. References  . . . . . . . . . . . . . . . . . . . . . .  . . 5
2.1 Normative References  . . . . . . . . . . . . . . . . . . . 6
2.1.3 Informative References  . . . . . . . . . . . . . . . . . . 7

需要一手捕获组(2.1.3信息参考)和(页码) 我现在有一些正则表达式可以捕获其中一个或另一个,但不能捕获它们。

我想知道我是否可以通过使用regrex来做到这一点,或者我应该只是通过编程来解析这些行。 谢谢大家!

2 个答案:

答案 0 :(得分:0)

这样的事情应该有效:

/^([\d\.]+\s+[\w\s]+?)[\s\.]+(\d+)$/

Capture group $ 1将返回“2.1.3 Informative References”,$ 2将返回页码。

答案 1 :(得分:0)

/([\d.]+[^.]+)[.\s]+(\d)/

根据您的Regex引擎,您应该能够分别从第一组和第二组中提取每行的标题和页码。