在OHE之后,我的数据如下:
client|feat1|feat2
1| 1| 0
3| 0| 1
5| 1| 0
我要将有关客户端/功能的信息添加到我的sparse df
中。我不能在这里简单地调用稀疏构造函数,因为索引(客户端ID)很重要。构造函数将返回3x3的稀疏矩阵,而实际上,我的sparse df
中至少有6行(此玩具示例中的最大id为5)。我知道如何一一创建和添加功能,即每次为每个功能创建稀疏矩阵(sparse df
中的客户端数量x 1 )并将此信息堆叠到{{ 1}}。
所以,我的问题是:
有没有一种有效的方法可以立即利用(添加到sparse df
中)有关客户ID的某些客户的所有OHE信息?