ILovePolitics,这基本上是一个句子,有3个单词。
我想知道提取这3个单词的最佳技巧。我可以使用字典,并检查此字符串是否有任何子字符串(匹配任何单词)将其保留在列表中。
如果"爱"匹配作为子字符串,将被添加到我的列表中,因为爱在此字符串中。
但这是一种更强大的力量,我将不得不用这个字符串检查每个单词,优化这个要求的最佳方法是什么?
答案 0 :(得分:1)
如果想要捕获CamelCase的单词,那么你可以使用这样的正则表达式:
([A-Z][a-z]*)
<强> Working demo 强>
捕获:I
Love
Politics
另一方面,如果你想捕获也以小写字母开头的单词,你可以这样做:
([A-Z][a-z]*|[a-z]+)
<强> Working demo 强>
捕获:I
Love
Politics
match
only
Camel
Case