Java正则表达式来组织文档部分

时间:2017-04-03 15:49:33

标签: java regex

我有一个包含多个部分的文件。这些部分以数字开头,后跟一些空格,然后是一行文本,这一行后跟一个空行,然后是一个段落。

示例:

  

1.2标题的标题
第一句。句子二。三句。

     

1.3另一部分的标题
第一句话。句子二。三句。

我需要一个正则表达式来捕获每个部分中的文本。我想做点什么:

找到一个数字后跟一个点后跟另一个数字后跟一个空格,然后获取后面的所有文本。

目前我正在尝试此^\d+[.]\d+\s\(.)

现在它无法正常工作。有什么建议吗?

1 个答案:

答案 0 :(得分:0)

您可以使用具有前瞻和单行标记的正则表达式,如下所示:

(\d\.\d)(.*?)(?=\d\.\d|$)

<强> Working demo