如何使用split或matcher将句子拆分为单词和标点符号?

时间:2015-03-25 12:35:23

标签: java regex parsing text split

我需要将句子分成单词和标点符号,并将em放入列表中,保存它们的顺序。

例如: "Some text here!"。结果应该是:List(Some, ,text, , here,!)

我使用String.split("regex");使用" split"我只能通过单词或仅通过标点符号来分割文本。

那么我应该使用什么来同时按字和标点分割文字? 提前谢谢。

1 个答案:

答案 0 :(得分:0)

基于

  

结果应为:列表(Some, ,text, , here,!)

您希望在word boundaries split("\\b")上分开。

String data = "Some text here!";
for (String s : data.split("\\b")){
    System.out.println("'"+s+"'");
}

输出:

'Some'
' '
'text'
' '
'here'
'!'