提取单词和缩写的java正则表达式是什么?

时间:2014-10-12 00:25:52

标签: java regex

考虑一下这句话:我在美国的U.C.L.A学习。我的一位教授'小孩是我最好的朋友。

使用this question中建议的正则表达式[\\w']+,我可以提取单词。但是,缩写的单词将作为每个字符的单独单词出现。因此,美国将被提取为U,S和A这三个词。我想提取像U.C.L.A这样的缩写词。和美国也是一个字。

请建议正则表达式。

增加一项额外要求: 喜欢" FBs"," GTs"应该被视为一个单词。

1 个答案:

答案 0 :(得分:0)

尝试这种模式
((?:[A-Z]\.)+[A-Z]?|[a-zA-Z']+)
Demo