如何从字符串中有效删除停用词。 现在我使用这个正则表达式,它在不到一秒的时间内为一个字符串删除了停用词。
var STOPWORDPATTERN = @"(\b)(yourselves|you've|yourself|yours|.....)(/b)";
value = Regex.Replace(
value,
STOPWORDPATTERN,
DELIMITER_TOKEN,
RegexOptions.IgnoreCase); //value is a string
但是,我有2000个字符串需要大约2秒来处理这个功能。我想知道是否有更有效的方法来处理?