python - 多标签分类问题的数据结构

我正在研究一个预测问题，其中用户有权访问多个Target，而每次访问都具有单独的行。以下是数据

df=pd.DataFrame({"ID":[12567,12567,12567,12568,12568],"UnCode":[LLLLLLL,LLLLLLL,LLLLLLL,KKKKKK,KKKKKK],
"CoCode":[1000,1000,1000,1111,1111],"CatCode":[1,1,1,2,2],"RoCode":["KK","KK","KK","MM","MM"],"Target":[12,4,6,1,6]
})

**Here ID is unique but can be repeated if user has accessed multiple targets and target can be repeated as well if accessed by different ID's**

我已将此数据转换为OHE，并使用二进制相关性进行预测，其中我的X不变，目标不断变化。

此方法面临的问题是数据变得稀疏，原始数据中的特征数量约为1300。

有人可以建议我这种方法是否正确，以及我可以在这种类型的问题中使用哪些其他方法/方法。还可以将此问题视为多标签分类吗？

下面是模型的输入数据

多标签分类问题的数据结构

0 个答案: