如何以有效的方式删除停用词?

时间:2017-08-22 04:17:04

标签: c# performance stop-words

如何从字符串中有效删除停用词。 现在我使用这个正则表达式,它在不到一秒的时间内为一个字符串删除了停用词。

var STOPWORDPATTERN = @"(\b)(yourselves|you've|yourself|yours|.....)(/b)";

            value = Regex.Replace(
            value,
            STOPWORDPATTERN,
            DELIMITER_TOKEN,
            RegexOptions.IgnoreCase); //value is a string

但是,我有2000个字符串需要大约2秒来处理这个功能。我想知道是否有更有效的方法来处理?

0 个答案:

没有答案