如何编码数据列python pandas

时间:2018-01-23 07:54:50

标签: python pandas numpy statistics

我有一个包含以下列的数据集:

Data preview

如图所示,1级是单变量,2级是双变量,3级是多变量。级别3可能会重复不同的级别2.如何在熊猫中将这些变量编码在一起,以便 成分+食物+容器 列合并为一个类别?

我想分析哪家供应商提供价格优惠的产品。

1 个答案:

答案 0 :(得分:0)

我相信你需要factorize将所有列加在一起:

df['new'] = pd.factorize(df['Level 1'] + df['Level 2'] + df['Level 3'])[0]