单词匹配句子 - 优化

时间:2015-04-15 19:53:24

标签: regex string optimization dictionary

ILovePolitics,这基本上是一个句子,有3个单词。

我想知道提取这3个单词的最佳技巧。我可以使用字典,并检查此字符串是否有任何子字符串(匹配任何单词)将其保留在列表中。

如果"爱"匹配作为子字符串,将被添加到我的列表中,因为爱在此字符串中。

但这是一种更强大的力量,我将不得不用这个字符串检查每个单词,优化这个要求的最佳方法是什么?

1 个答案:

答案 0 :(得分:1)

如果想要捕获CamelCase的单词,那么你可以使用这样的正则表达式:

([A-Z][a-z]*)

<强> Working demo

enter image description here

捕获:I Love Politics

另一方面,如果你想捕获也以小写字母开头的单词,你可以这样做:

([A-Z][a-z]*|[a-z]+)

<强> Working demo

捕获:I Love Politics match only Camel Case