如何使用VB.NET在句子中找到和,或等,a,no,with等等词语并删除它们。另外我在哪里可以找到如上所列的所有单词。
答案 0 :(得分:4)
请注意,除非您使用Regex word boundaries,否则可能会与Scunthorpe (Sfannythorpe) problem发生冲突。
string pattern = @"\band\b";
Regex re = new Regex(pattern);
string input = "a band loves and its fans";
string output = re.Replace(input, ""); // a band loves its fans
请注意'band'中的'和'不受影响。
答案 1 :(得分:3)
您确实可以使用.Replace函数替换您的单词列表(如所述的colithium)...
myString.Replace("and", "")
修改强>
...但实际上,更好的方法是使用正则表达式(如edg建议的那样)以避免替换部分单词。
正如您的问题表明您希望清理一句话以保留有意义的词语,您必须做的不仅仅是删除两个和三个字母的单词。
您需要的是停用词列表: http://en.wikipedia.org/wiki/Stop_word
可以在此处找到英语停止词的逗号分隔列表: http://www.textfixer.com/resources/common-english-words.txt
答案 2 :(得分:0)
最简单的方法是:
myString.Replace(“and”,“”)
您将循环显示单词列表,并具有如上所述的语句。谷歌的常用英语单词列表?
List of English 2 Letter Words
List of English 3 Letter Words
答案 3 :(得分:0)
您可以匹配单词并使用正则表达式删除它们。