应用错误收集

我想在我的ealsticsearch结果中过滤出带有仇恨词的文档。目前，我们在每个搜索查询中都有bool过滤器来查找所有单词的列表。这导致了大量的慢查询，因为仇恨词的列表很长（围绕着仇恨:(）

我想知道这种垃圾邮件/仇恨词过滤的最佳做法是什么。

以下是我们正在考虑的事项：

预处理：在编制索引之前扫描文档，因此将其标记为错误或不对其进行索引。问题：文档是从多个进程编制索引的，并且很难强制规则对任何人编写的任何新组件。
创建一个过滤器并定期运行（不确定最佳频率和时间）将所有带有坏词的文件标记为＆＃34; badDoc＆＃34; ：是的。因此在所有查询中都有一个过滤器。问题：由于定期运行过滤器而不确定性能影响，其次是所有查询中排除badDoc的相同问题

我个人赞成纯ES解决方案，我相信这不是一个新问题，因此寻求专家指导和最佳实践。

谢谢和问候 VARUN