PostgreSQL计算关键字匹配中每个关键字的频率

时间:2016-05-11 13:39:19

标签: postgresql postgresql-9.4

基本上我正在检查列是否包含数组中的任何关键字列表

SELECT COUNT(*) FROM table WHERE value ILIKE ANY (ARRAY['%bat%', '%cat%', ...])

哪种方式可以很好地为我提供包含这些关键字的列的总数,但我还想计算每个关键字被击中的次数。理想情况下,我最终会

 Keyword   |   Count
---------------------
 bat       |     4
 cat       |    10

等等。有任何想法吗?谢谢!

1 个答案:

答案 0 :(得分:1)

使用正则表达式来测试文本中的完整单词会更好:

with
  words(word) as (values ('bat', 'cat'))

select w.word, count(*)
from words w
join table t on (t.value ~* ('\m'||w.word||'\M'))
group by w.word;

如果您需要区分大小写的搜索,请将~*替换为~