有效地将OHE转换为稀疏

时间:2020-03-04 14:30:41

标签: python pandas numpy scipy sparse-matrix

在OHE之后,我的数据如下:

client|feat1|feat2
     1|    1|    0
     3|    0|    1
     5|    1|    0

我要将有关客户端/功能的信息添加到我的sparse df中。我不能在这里简单地调用稀疏构造函数,因为索引(客户端ID)很重要。构造函数将返回3x3的稀疏矩阵,而实际上,我的sparse df中至少有6行(此玩具示例中的最大id为5)。我知道如何一一创建和添加功能,即每次为每个功能创建稀疏矩阵(sparse df中的客户端数量x 1 )并将此信息堆叠到{{ 1}}。

所以,我的问题是:

有没有一种有效的方法可以立即利用(添加到sparse df中)有关客户ID的某些客户的所有OHE信息?

0 个答案:

没有答案