如何获得一个值的熊猫系列虚拟表示

时间:2018-11-07 15:21:21

标签: python pandas machine-learning categorical-data dummy-variable

假设我有5个不同的类别

categories = {'a', 'b', 'c', 'd', 'e'}

是否可以使用Pandas的get_dummies获得一个元素的虚拟表示?即,假设我有

element = 'a'

成为

Series({
 'a' : 1, 
 'b' : 0,
 'c' : 0,
 'd' : 0,
 'e' : 0,
 })

1 个答案:

答案 0 :(得分:0)

请检查是否有帮助。这将生成所有类别的假人。

categories = {'a', 'b', 'c', 'd', 'e'}

categoriesSeries = pd.Series(list(categories))
pd.get_dummies(categoriesSeries)

结果

   a  b  c  d  e
0  0  0  0  0  1
1  0  0  1  0  0
2  0  0  0  1  0
3  0  1  0  0  0
4  1  0  0  0  0

现在要为一个元素生成一个虚拟对象,您可以像这样传递索引。

pd.get_dummies(categoriesSeries[4])

结果

   a
0  1