我正在研究一个预测问题,其中用户有权访问多个Target,而每次访问都具有单独的行。以下是数据
df=pd.DataFrame({"ID":[12567,12567,12567,12568,12568],"UnCode":[LLLLLLL,LLLLLLL,LLLLLLL,KKKKKK,KKKKKK], "CoCode":[1000,1000,1000,1111,1111],"CatCode":[1,1,1,2,2],"RoCode":["KK","KK","KK","MM","MM"],"Target":[12,4,6,1,6] }) **Here ID is unique but can be repeated if user has accessed multiple targets and target can be repeated as well if accessed by different ID's**
我已将此数据转换为OHE,并使用二进制相关性进行预测,其中我的X不变,目标不断变化。
此方法面临的问题是数据变得稀疏,原始数据中的特征数量约为1300。
有人可以建议我这种方法是否正确,以及我可以在这种类型的问题中使用哪些其他方法/方法。还可以将此问题视为多标签分类吗?
下面是模型的输入数据