我有一个这样的数组:
X = [0,0,1,1,0,0,1,1,1,0,0,0]
我想创建一个nx2
的单热编码器向量one_hotX = [[1,0],[1,0],[0,1],[0,1],[1,0]...]
有一种简单的方法吗? OneHotEncoder和LabelEncoder似乎无法正常工作。
答案 0 :(得分:3)
如何自己构建矢量:
[[0, 1] if i else [1, 0] for i in X]
#[[1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [1, 0]]
如果您正在使用numpy
,您也可以执行此类操作(矢量化方法):
import numpy as np
code = np.array([[1,0],[0,1]])
arrX = np.array(X)
code[arrX]
#array([[1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [1, 0]])