Question

我在正则表达式领域相对较新：我需要一些帮助来确定以下模式：

1. Scope  . . . . . . . . . . . . . . . . . . . . . . .  . . .  4
2. References  . . . . . . . . . . . . . . . . . . . . . .  . . 5
2.1 Normative References  . . . . . . . . . . . . . . . . . . . 6
2.1.3 Informative References  . . . . . . . . . . . . . . . . . . 7

需要一手捕获组（2.1.3信息参考）和（页码）我现在有一些正则表达式可以捕获其中一个或另一个，但不能捕获它们。

我想知道我是否可以通过使用regrex来做到这一点，或者我应该只是通过编程来解析这些行。谢谢大家！

Answer 1

这样的事情应该有效：

/^([\d\.]+\s+[\w\s]+?)[\s\.]+(\d+)$/

Capture group $ 1将返回“2.1.3 Informative References”，$ 2将返回页码。

Answer 2

/([\d.]+[^.]+)[.\s]+(\d)/

根据您的Regex引擎，您应该能够分别从第一组和第二组中提取每行的标题和页码。

使用REGEX模式识别TOC条目

2 个答案: