我有一个单词列表L1,并且有候选列表,如B1,B2 ..,Bn,所有列表的长度相同。但他们没有相同的元素。列表不包含重复元素。 L1最类似于B1,B2 ... Bn中的一个。我可以应用哪种算法来找到与L1最相关的列表?
一些潜在的算法是编辑距离,等级相关性(两个列表上应该具有相同的元素,而不是我的情况),骰子和jaccard。我也不确定“相关”这个词是什么?这个在这种情况下有效吗?
编辑:我有一套文档和2个主题建模算法A1和A2。我通过应用A2将A1应用于文档集以及另外10个主题来获得10个主题。因此,上面的列表定义了这些主题中的单词。所以现在我想找到这两个算法A1和A2创建的类似主题。