在一个热编码

时间:2016-10-19 19:07:07

标签: python arrays numpy

我有一个数组,它是所有标签的热门编码,例如

[
 [
  [0,0,0]
  [1,0,0],
  [0,0,1]
 ],
 [
   [0,0,0],
   [0,0,0],
   [0,0,1],
 ]
]

我想得到这个:

[
 [1,0,1],
 [0,0,1]
]

标签数组的大小相同([0,0,0]表示没有标签)

我该怎么做?我尝试了很多东西,但我是一个蟒蛇和numpy的菜鸟。

修改

我认为这应该有效

[np.sum(x, axis=0) for x in array_tags]

但如果我运行它,python(2.7)会崩溃。任何线索?

1 个答案:

答案 0 :(得分:0)

我在scikit-learn上找到了我想要的东西。我需要使用MultiLabelBinarizer