ML分类,如何处理具有2个信息的单元格?

时间:2019-03-01 19:18:39

标签: machine-learning bigdata classification multilabel-classification multiclass-classification

所以我有一种无法摆脱的情况。对于机器学习及其社区,我还算陌生。 我正在尝试建立分类模型,但这是我的问题:

所以可以说我有2个X(变量;文本或整数)列和1个Y(我试图预测)列。

这X列之一源自具有重复行的数据集,但是重复项中的某些信息对我的工作而言是不同的且重要的。

让我尝试举一个示例;

产品编号 变量1 Y
1 result1
2橙色result2
3香蕉,苹果result1
4 bluebarrybar result3
5香蕉result5

因此,如您在第3行中所见,有两个信息对我来说很有价值。如何在分类模型中处理这种情况?抱歉,如果很明显。我是ML的新手:)

编辑注意:变量1列具有大量数据和大约一千种不同的信息。我的模型ofc没有1变量。真实模型的尺寸已经很高。

0 个答案:

没有答案