在列表中使用通配符排除相似的术语

时间:2018-11-22 05:17:30

标签: amazon-redshift

我们想在字数查询中排除常用词和停用词,某些术语会稍有变化,例如“ account”,“ accounts”,“ account。”等。是否可以使用类似“排除列表中的通配符(例如LIKE函数的_)以排除所有变体?有成千上万的单词,“帐户”只是一个例子。

查询:

SELECT subject
from subject_table
WHERE subject NOT IN ('', 'and', 'for', 'of', 'account')

1 个答案:

答案 0 :(得分:1)

尝试使用[REGEXP_INSTR][1]

SELECT subject
from subject_table
WHERE REGEXP_INSTR(subject, '(and|for|of|account.*)') = 0