将功能结果附加到数据框

时间:2019-07-10 06:46:38

标签: python pandas machine-learning random-forest confusion-matrix

我尝试将依赖循环的值分配给python中的数据框。

我有以下起始数据框:

thres = 0.1
d = { 'T': [0.], 'TN': [0], 'FN': [0], 'FP':[0], 'TP':[0]}
dataframef = pd.DataFrame(data=d)

和我的起始变量thres

现在我进入循环:

while thres <= 0.4:
    a = { 'T': [0], 'TN': [0], 'FN': [0], 'FP':[0], 'TP':[0]}
    dataframe = pd.DataFrame(data=a)
    y_pred = predictionthreshold(RandomForestClassifier(random_state=42), thres)
    tn, fp, fn, tp = confusion_matrix(y_test.ravel(), y_pred).ravel()
    dataframe.loc[0]['T'] = thres
    dataframe.loc[0]['TN'] = tn
    dataframe.loc[0]['FP'] = fp
    dataframe.loc[0]['FN'] = fn
    dataframe.loc[0]['TP'] = tp    
    dataframef = dataframef.append(dataframe, ignore_index=True)
    thres=thres+0.1

我的结果是:

    T   TN  FN  FP  TP
0   0.0     0   0   0   0
1   0.0     0   0   0   0
2   0.0     0   0   0   0
3   0.0     0   0   0   0
4   0.0     0   0   0   0

我希望有一些东西可以逐步填充数据框:

    T   TN  FN  FP  TP
0   0.1     1   0   0   0
1   0.2     0   3   0   0
2   0.3     0   0   2   0
3   0.4     0   0   0   0
4   0.5     0   4   0   4 

其中的错误在哪里?并且有避免循环的优雅方法吗?

1 个答案:

答案 0 :(得分:1)

像这样更改分配:

dataframe.loc[0,'T'] = thres
dataframe.loc[0,'TN'] = tn
dataframe.loc[0,'FP'] = fp
dataframe.loc[0,'FN'] = fn
dataframe.loc[0,'TP'] = tp 

使用dataframe.loc[0]['TP'] = tp时,您将tp分配给副本,而不是原始数据帧。有关详细信息,请参见Returning a view versus a copy