标签: algorithm search indexing full-text-indexing
我需要快速对多达5亿个唯一的字符串进行子字符串搜索,每个字符串的长度小于256个字符。这需要支持子字符串匹配(“ abcde”中的“ bcd”);并且我将不断在索引中添加新的/现有的字符串。
哪种方法最适合利用我的后备键-值存储区(例如,思考一下leveldb)的有序特性?