标签: python multithreading levenshtein-distance
我让算法在单个线程中工作,保持返回的最短编辑距离。我知道内置的LD函数已经用C语言编写,但是我有数千个字符串来搜索最佳匹配,字符串的长度平均为50个字符。所以这听起来像是一个很好的并行应用程序,我可以将列表分成2,并将调用部分分配给在2个独立核心上运行的两个不同线程。理想情况下,我认为最好有一个特殊版本的LD(Levenshtein距离)算法,如果到目前为止的距离超过最佳值,它将获得最佳匹配作为参数并且提前返回(在整个距离计算之前)。在列表中的先前刺痛中获得的匹配。