一个热门编码器:如何编码同类别的多个值?

时间:2016-05-10 23:26:46

标签: python scikit-learn one-hot-encoding

我要预测一部电影的票房。假设只有一个分类特征"演员"使用值" A"," B"," C"。我将它们作为[1,0,0],[0,1,0],[0,0,1]包围,如果电影有多个演员,例如A和B都应该将其编码为[1,1,0][1,0,0,0,1,0]

1 个答案:

答案 0 :(得分:1)

你应该将每个表示为整数并将它们or表示在一起

A=int("100",2)
B=int("010",2)
C=int("001",2)
print A,B,C
movie = A|B
print movie
print bin(movie)