我正在使用名单列表来查找一个列表中最相似的一对字符串到另一个列表
best_match = {'name_1':[],'name_2':[]}
for name_1 in first_list:
similarity = 0
max_similarity = 0
for name_2 in second_list:
similarity = (difflib.SequenceMatcher(None,name_1,name_2).ratio())
if similarity > max_similarity:
max_similarity = similarity
names_pair = (name_1,name_2)
best_match['name_1'].append(names_pair[0])
best_match['name_2'].append(names_pair[1])
是否可以使用pandas对这种操作进行矢量化?
编辑:
目前,我没有使用大熊猫,我只是使用该标准。
我只有两个单词列表:
list_1 = ['word_1','word_2','word_4']
list_2 = ['adaad','dddda','wxrd_1',vord_2']
对于该输入,该单词应该返回:
{'name_1':['word_1','word_2'],'name_2':['wxrd_1','vord_2']}