永远在线的模式匹配服务,无抖动

时间:2019-04-17 09:38:21

标签: string algorithm architecture string-matching

我正在考虑实现一个用于过滤数据的系统。这依赖于大型数据集的快速模式匹配(我在考虑Aho-Corasick)。模式将是固定的字符串。这可能在1000-100000条记录的范围内-对于关系数据库来说不是很大,但是对于内存中的图来说却很大。性能的关键(与基础算法无关)是创建参考数据集的适当表示形式。数据集将随着时间而改变。

我的问题是如何最好地构建此解决方案,以使更新数据集不会中断服务的使用。更新不必立即反映给服务客户端。

是否有一种快速的字符串匹配算法,可以在不进行完全重新编译的情况下支持对数据集进行临时更改?

如果没有,大概我唯一的选择就是将前端服务与后端匹配引擎/分开,并在我想更改数据集时启动新的后端引擎/切换。

有没有更优雅的解决方案?

0 个答案:

没有答案