如何在Java

时间:2015-07-15 15:56:23

标签: java regex string split

我目前正在处理文本处理,并因一个简单的问题而分心。我试图根据下划线拆分句子。首先,我想出了一个非常简单的方法:

String[] tokens = taggedSentence.split("_");

在大多数情况下它都可以正常工作,直到我找到了如下所示的文字:

Robert_Phd_NNP

但是,我只对POS标签感兴趣,在这种情况下是NNP,但似乎单独用下划线分割是不够的。然后,我想出了一个想法来获得分句的最后一个元素:

String[] tokens = taggedSentence.split("_");
int tokenSize = tokens.length;
String pos = tokens[tokenSize-1];

但是,我想知道是否有更好的方法(比如正则表达式,也许)这样做。任何评论或建议将非常感激。 非常感谢

1 个答案:

答案 0 :(得分:6)

如果没有正则表达式,您可以轻松完成此任务:

String POStag = taggedSentence.substring(taggedSentence.lastIndexOf('_') + 1);

如果没有下划线,则只返回原始字符串。