对于非常快速的算法的建议,我很感激,这些算法可以确定字符串数据库中是否不存在8字节的字符串,其中每个字符串的长度也为8字节。数据库中有数亿个字符串。数据库中可能存在字符串簇。我正在考虑使用Aho Corasick算法,但希望可以有更快的技术。
非常感谢您的帮助。
答案 0 :(得分:0)
我不在乎您会找到哪种算法,因为行扫描数以亿计的行是一种解决方案,因此人们对此一无所知。使用数据库索引可以解决您正在执行的操作类型,因为您可以立即做出这些确定。既然您说的是要搜索的匹配项(字节数)是数据库中的内容,那么使用索引应该非常合适。