删除postgresql中没有词干的停止词

时间:2017-02-05 12:41:03

标签: postgresql full-text-search stop-words

我想从我的数据中删除停用词,但我不想阻止这些词,因为确切的词对我很重要。 我用过这个查询。

SELECT to_tsvector('english',colName)from tblName order by lower asc;

有没有什么方法可以删除stopWords而不会阻止词语?

感谢

1 个答案:

答案 0 :(得分:9)

创建自己的文本搜索词典和配置:

CREATE TEXT SEARCH DICTIONARY simple_english
   (TEMPLATE = pg_catalog.simple, STOPWORDS = english);

CREATE TEXT SEARCH CONFIGURATION simple_english
   (copy = english);
ALTER TEXT SEARCH CONFIGURATION simple_english
   ALTER MAPPING FOR asciihword, asciiword, hword, hword_asciipart, hword_part, word
   WITH simple_english;

它的工作原理如下:

SELECT to_tsvector('simple_english', 'many an ox eats the houses');
┌─────────────────────────────────────┐
│             to_tsvector             │
├─────────────────────────────────────┤
│ 'eats':4 'houses':5 'many':1 'ox':3 │
└─────────────────────────────────────┘
(1 row)

您可以将参数default_text_search_config设置为simple_english,使其成为默认的文字搜索配置。