来这里。
我正在尝试利用tsvector来计算术语的频率。 我想我差不多了,但我找不到从tsvector结构中获取条款的方法。
创建tsvector列后,我所做的是:
select term_tsv, count(*) count from (select unnest(term_tsv) term_tsv from document_tsv) t group by term_tsv order by count desc;
结果如下:
stem_tsv | count
------------------------+-------
(3,{9},{D}) | 1
我不知道括号代表什么样的表达。
谁能告诉我如何从shell中提取这个术语?
谢谢。
答案 0 :(得分:0)
我发现以下内容列出了十大频繁参赛作品,
这是在官方手册中写的。
SELECT * FROM ts_stat('SELECT vector FROM apod')
ORDER BY nentry DESC, ndoc DESC, word
LIMIT 10;
仅供记录。