我有一些数据集是所有分类数据,带有唯一标签。 像这样:
X =
1,1,1,0,1,0,0,0,1,0
1,1,0,1,1,0,1,1,1,1
0,0,1,0,0,0,1,0,0,1
.
.
.
1,0,0,1,0,0,1,1,0,1
y =
AA
AB
AC
.
.
.
ZZ
我认为这个问题应该解决机器学习以外的问题,但我的老板强迫我使用机器学习或深度学习算法。
所以我的问题是:
解决这个问题的最佳非机器学习算法是什么?
解决此问题的最佳机器学习算法是什么?
答案 0 :(得分:0)
作为分类问题,它没有任何意义。您必须有许多具有相同标签的行,才能通过任何分类算法从数据中推导出某些内容。 我可以建议通过将标签转换为唯一数字(使用字母表中的字母数字或类似的数字)将此问题转换为回归。然后,您可以使用任何回归算法来假设未标记数据的数量。最后,您可以将这些数字转回文本标签。我不确定这会有效,但你可以试试。
AA -> 0
AB -> 1
...
AZ -> 25
BA -> 1 * 26 + 0 = 26
...
ZZ -> 26 * 25 + 25