我有一个数据集,其中每一行都是客户生命周期的一个时间点。我对具有目标变量的数据进行了逻辑回归,以了解客户是否“流失”。我捕获了预测并将其添加到数据框中。以下是带有预测的样本数据集:
我现在想为每个单独的客户计算出正确做出预测的时间是多少?然后汇总整个客户集以为分类模型构建自定义指标。
答案 0 :(得分:0)
好吧,这就是我计算指标的方式。如果有人知道更好的解决方案,请告诉我:
total_count = 0
true_pred = 0
tenure= validation_data['tenure'].unique()
for i in range(len(tenure)):
running_tenure = i+1
for index, row in validation_data.iterrows():
if row['tenure'] == running_tenure :
total_count += 1
if row['churn'] == row['pred_churn']:
true_pred += 1
Accuracy = float(float(true_pred)/total_count)))