我正在使用C#
阅读以下部分文字“我必须看到你的驾驶执照并在我发送给你之前给你打印一个身份证号码,”他以平面,自动的方式说道,茫然地盯着角。
我正在阅读这本书的某些内容,我想用所有单词创建字符串,包括带有撇号的单词。我想基于非单词字符分割线条,但是我希望撇号包含在单词字符中,所以我最终得到一个只带有单词的字符串列表,因此单词“driver's”就在一起。
我正在使用sublime来测试表达式,但是当我执行(\W+|\')
时,仍会捕获撇号。我不想把像“你”这样的东西分成两个字符串。 \W+
很完美,但我只想加入撇号。我怎么能这样做?
答案 0 :(得分:1)
如果您正在寻找正确的匹配"在"之间单词:
[^\w']+
应该这样做。
答案 1 :(得分:0)
您可以尝试String.Split:示例如下
string _input ="I have to see your driver’s license and print you an ID tag before I can send you through";
string[] _words = _input.Split(' ');
如果您要删除其他字符,例如:单引号(撇号)"'"和逗号","并使用Replace(),如:
_input = _input.Replace("'", String.Empty).Replace(",",String.Empty);
string[] _words = _input.Split(' ');
您也可以使用Regex,但其性能比这些方法更差(如果它确实重要)。
另外,您可以尝试我的语义分析器'应用程序位于:http://webinfocentral.com/TECH/SemanticAnalyzer.aspx。它正在做所有这些事情以及更多(要排除的字符列在左侧窗格中)。 RGDS,