合并列而不丢失其在熊猫中的交互信息?

时间:2018-10-03 22:46:12

标签: pandas machine-learning data-science

这是分类任务。 这是数据集的格式enter image description here

第一行包含患者的标签。

最初,我想对表格进行转置以将患者ID作为索引,但是我不确定如何将列的区域,位置和基因归为一列。

如果我只是合并列以创建列名,那么我会在建模过程中丢失很多信息,因为例如对于基因1在位置78的区域4和位置74和区域5的行为可能相同。 因此,如果我仅合并这些列,则这些列之间的交互信息可能会丢失。

有人可以建议,如何获取患者ID作为我的索引,同时又保留有关这些列相互作用的所有信息以进行统计分析?

0 个答案:

没有答案