尝试在数据框中找到一列与另一列的相似程度

时间:2019-06-25 20:53:56

标签: python pandas dataframe machine-learning metrics

我正在尝试计算准确率。

我有一个熊猫数据框,其中包含许多列数据。

我为每位客户提供一列预测客户流失和一列真实客户流失。

是否有一种方法可以仅在两列之间计算准确性指标和其他指标?这两列都是二进制,只有0表示没有搅动,而只有1表示搅动。

1 个答案:

答案 0 :(得分:3)

很明显,您可以采用多种方法来根据已知答案衡量预测的准确性。由于您是使用机器学习和python标记的,因此我建议使用混淆矩阵(即错误矩阵)作为第一遍。 scikit-learn python库具有一个您可以使用的模块:

class Progress extends React.Component {
    render() {
        return (
            <View style={css.top}>
                <View style={css.bar}>
                    <View style={css.brown}</View>
                </View>

            </View>
        );
    }   
}

const css = StyleSheet.create({
    top:{
        backgroundColor:'red',
        width:400,
        height:400,
        padding:100
    }
    bar: {
        flex:1,
        backgroundColor:'yellow',
        position:'relative'
    },
    brown: {
        backgroundColor:'brown',
        position:'absolute',
        top:0,
        left:0,
        width:100,
        height:100,
    },
});

来源:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html