在熊猫中添加带有列表作为行的数据框

时间:2020-03-21 20:59:07

标签: python pandas

我正在计算输入文本和列表之间的Levenshtein距离。我想将此信息存储在数据框中,以便以后进行进一步分析。

在将由函数生成的此列表分配给创建的数据框时遇到问题。

col_list = data_df.clean_text_items.unique()
levenshtein_ratio_matrix_df = pd.DataFrame(columns= col_list)

def levenshtein_compare_to_list(row):
    row_levenshtein_ratio = []

    for i in collist:
        row_levenshtein_ratio.append(levenshtein (row['clean_text_source_item'], i))

    levenshtein_ratio_matrix_df.append(row_levenshtein_ratio)

for index, row in data_df.iterrows():
    levenshtein_compare_to_list(row) 

以下运行,如果我在每个循环中打印出row_levensthein_ratio,它将显示正确的值,但实际上并没有附加数据框。 (levenshtein_ratio_matrix_df留为空白)

1 个答案:

答案 0 :(得分:0)

找到答案

  df_length = len(levenshtein_ratio_matrix_df)
  levenshtein_ratio_matrix_df.loc[df_length] = row_levenshtein_ratio

代替

 levenshtein_ratio_matrix_df.append(row_levenshtein_ratio)