将唯一类别名称转换为整数

时间:2017-05-04 08:07:06

标签: python arrays python-2.7 pandas

在Iris数据集中,'target_names'或花标签('setosa','versicolor','virginica')由'target'表示,其为0,1或2:

iris = load_iris()
iris
  

'target':array([0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,           0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,           0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,           1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,           1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2 2,2           2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,           2,2,2,2,2,2,2,2,2,2,2 2]),    'target_names':array(['setosa','versicolor','virginica'],          D型= '| S10')}

现在我有一个训练数据集,看起来像这样:

> Photography         0.1 0.1 0.1 0.1 0.1
> Social              0.2 0.2 0.2 0.2 0.2
> Libraries and Demo  0.3 0.3 0.3 0.3 0.3
> Arcade and Action   0.4 0.4 0.4 0.4 0.4
> Health and  Fitness 0.5 0.5 0.5 0.5 0.5

如何更改我的标签('摄影','社交'等)以用目标值表示,即0,1,2等,就像我们在Iris数据集中看到的那样?

共有20,000个行和14,000列共有30个唯一标签。

0 个答案:

没有答案