多标签分类问题的数据结构

时间:2019-12-18 07:11:45

标签: python machine-learning

我正在研究一个预测问题,其中用户有权访问多个Target,而每次访问都具有单独的行。以下是数据

df=pd.DataFrame({"ID":[12567,12567,12567,12568,12568],"UnCode":[LLLLLLL,LLLLLLL,LLLLLLL,KKKKKK,KKKKKK],
"CoCode":[1000,1000,1000,1111,1111],"CatCode":[1,1,1,2,2],"RoCode":["KK","KK","KK","MM","MM"],"Target":[12,4,6,1,6]
})

**Here ID is unique but can be repeated if user has accessed multiple targets and target can be repeated as well if accessed by different ID's**

我已将此数据转换为OHE,并使用二进制相关性进行预测,其中我的X不变,目标不断变化。

此方法面临的问题是数据变得稀疏,原始数据中的特征数量约为1300。

有人可以建议我这种方法是否正确,以及我可以在这种类型的问题中使用哪些其他方法/方法。还可以将此问题视为多标签分类吗?

下面是模型的输入数据

Input for model

0 个答案:

没有答案