我一直在使用postgres中的全文搜索,我想知道,是否可以返回所有行的总字数?
所以,假设你有
text_col
_______
'dog'
'dog cat'
'dog bird dog'
'狗'的数量应该是4,'猫'的数量应该是1,鸟也应该是1。
现在我将所有tsvector保存到gin索引列中。
当然,这将是所有行,你可以说像
select max(ts_count(text_col_tsvector)) from mytable;
(我做到了,但我希望你能得到一般的想法)
是否只能返回lexeme的计数,如果是,则如何返回返回的lexeme的字典(或数组)。
答案 0 :(得分:3)
怎么样:
select * from ts_stat('select text_col_tsvector from mytable')
编辑: 你的意思是:
with words as (
select regexp_split_to_table(text_column , E'\\W+') as word
from mytable
)
select word, count(*) as cnt from words group by 1 order by 2 desc