鉴于令牌,postgres可以使用词典来查找一组词汇。
select * from ts_lexize('english_stem', 'bananas');
ts_lexize
-----------
{banana}
(1 row)
是否可以反转此过程,即将一组词位转换为一组标记?
如果提前知道整套可能的令牌,那么ts_debug
可能会有效:
select lexemes, token from ts_debug('english', 'bananas banana kiwis')
where lexemes is not null;
lexemes | token
----------+---------
{banana} | bananas
{banana} | banana
{kiwi} | kiwis
(3 rows)
不幸的是,在我的情况下,我没有整套可能的令牌。