矢量化搜索操作

时间:2016-07-17 16:07:45

标签: python pandas search

我正在使用名单列表来查找一个列表中最相似的一对字符串到另一个列表

best_match = {'name_1':[],'name_2':[]}
for name_1 in first_list:
    similarity = 0
    max_similarity = 0
    for name_2 in second_list:
        similarity =   (difflib.SequenceMatcher(None,name_1,name_2).ratio())
        if similarity > max_similarity:
            max_similarity = similarity
            names_pair = (name_1,name_2)
    best_match['name_1'].append(names_pair[0])
    best_match['name_2'].append(names_pair[1])

是否可以使用pandas对这种操作进行矢量化?

编辑:

目前,我没有使用大熊猫,我只是使用该标准。

我只有两个单词列表:

list_1 = ['word_1','word_2','word_4']
list_2 = ['adaad','dddda','wxrd_1',vord_2']

对于该输入,该单词应该返回:

{'name_1':['word_1','word_2'],'name_2':['wxrd_1','vord_2']}

0 个答案:

没有答案