如何忽略包含重音的所有单词(非英语单词)?

时间:2011-09-09 20:54:58

标签: java regex

我正在创建一个Java应用程序,我有一个段落,我想从中获取单词。我想写一个正则表达式来只抓取英语单词并忽略其中包含重音的单词(有一个或多个非英语字母)。

示例:berøresafellereraførende为TEAM

我应该使用\ p {M}还是什么?

1 个答案:

答案 0 :(得分:2)

这将匹配包含字母A-Z的所有单词。

(?:^|\s)[a-zA-Z]+(?=\s|$)

有些正则表达式会在重音字符上匹配\b。因此,如果需要,您需要在前瞻中添加标点符号。