正则表达式命令,OR似乎不起作用

时间:2014-06-27 02:01:19

标签: regex sublimetext2

我正在使用C#

阅读以下部分文字
  

“我必须看到你的驾驶执照并在我发送给你之​​前给你打印一个身份证号码,”他以平面,自动的方式说道,茫然地盯着角。

我正在阅读这本书的某些内容,我想用所有单词创建字符串,包括带有撇号的单词。我想基于非单词字符分割线条,但是我希望撇号包含在单词字符中,所以我最终得到一个只带有单词的字符串列表,因此单词“driver's”就在一起。

我正在使用sublime来测试表达式,但是当我执行(\W+|\')时,仍会捕获撇号。我不想把像“你”这样的东西分成两个字符串。 \W+很完美,但我只想加入撇号。我怎么能这样做?

2 个答案:

答案 0 :(得分:1)

如果您正在寻找正确的匹配"在"之间单词:

[^\w']+

应该这样做。

答案 1 :(得分:0)

您可以尝试String.Split:示例如下

string _input ="I have to see your driver’s license and print you an ID tag before I can send you through";
string[] _words = _input.Split(' ');

如果您要删除其他字符,例如:单引号(撇号)"'"和逗号","并使用Replace(),如:

_input = _input.Replace("'", String.Empty).Replace(",",String.Empty);
string[] _words = _input.Split(' ');

您也可以使用Regex,但其性能比这些方法更差(如果它确实重要)。

另外,您可以尝试我的语义分析器'应用程序位于:http://webinfocentral.com/TECH/SemanticAnalyzer.aspx。它正在做所有这些事情以及更多(要排除的字符列在左侧窗格中)。 RGDS,