假设我有一个包含两列和一个字符串列表(my_string)的数据框(df)。
目标是找到my_string中每个字符串与col_2之间的最长匹配,并插入col_1的对应值作为输出。 因此,例如,如果:
my_string = ['289', '1', '12']
col_1 col_2
df = [A 123
B 230
C 17]
我希望输出应为[B,[A,C],A]
尝试了difflib的find_longest_match函数,但是没有运气。
任何帮助将不胜感激。