标签: java regex
考虑一下这句话:我在美国的U.C.L.A学习。我的一位教授'小孩是我最好的朋友。
使用this question中建议的正则表达式[\\w']+,我可以提取单词。但是,缩写的单词将作为每个字符的单独单词出现。因此,美国将被提取为U,S和A这三个词。我想提取像U.C.L.A这样的缩写词。和美国也是一个字。
[\\w']+
请建议正则表达式。
增加一项额外要求: 喜欢" FBs"," GTs"应该被视为一个单词。
答案 0 :(得分:0)
尝试这种模式 ((?:[A-Z]\.)+[A-Z]?|[a-zA-Z']+) Demo
((?:[A-Z]\.)+[A-Z]?|[a-zA-Z']+)