将文本拆分为文本末尾有“空格”的段落?

时间:2016-10-12 19:00:02

标签: java regex string pattern-matching

使用此(?sm)^.*?\.$我从文本中检索每个段落。

如果文本末尾有“空格”,则最后一段不匹配。我需要用什么来解决这个问题?

示例文字:

Copyright laws are changing all over the world. Be sure to check the
copyright laws for your country before downloading or redistributing
this or any other Project Gutenberg eBook.

This header should be the first thing seen when viewing this Project
Gutenberg file.  Please do not remove it.  

Please read the "legal small print", and other information about the
eBook and Project Gutenberg at the bottom of this file.    

regex101 example

2 个答案:

答案 0 :(得分:4)

我使用((?:[^\n][\n]?)+)因为我参与了我的学校项目。它会捕获您用至少一行(\n)分隔的所有段落。

它很简单:只捕获不是换行符的所有内容。

检查Regex101输出。

答案 1 :(得分:2)

如果你想修复你的正则表达式,那么你可以在模式的末尾添加\s*

(?sm)^.*?\.\s*$

但是,您可以使用带有正则表达式的split方法:

^\t*$

<强> working demo