标签: python pandas data-science
我正在尝试使用Pandas在Python中对客户数据进行分段。我的数据集中有一个客户ID变量。我在这里感到困惑,即使它不会被视为影响Output变量的变量。如果需要,我们如何实际处理这个变量,分类还是数字?
此外,是否有商业案例可以考虑将考虑customerID的位置?
答案 0 :(得分:1)
我认为您不应该将customerID用作变量。这是每个客户的独特价值。它可以用作索引 - 了解客户属于预测的内容。
因此,您最好从培训/测试数据中删除此专栏。