Question

我有一些数据集是所有分类数据，带有唯一标签。像这样：

X =

1,1,1,0,1,0,0,0,1,0

1,1,0,1,1,0,1,1,1,1

0,0,1,0,0,0,1,0,0,1

.

.

.

1,0,0,1,0,0,1,1,0,1

y = 

AA

AB

AC

.

.

.

ZZ

我认为这个问题应该解决机器学习以外的问题，但我的老板强迫我使用机器学习或深度学习算法。

所以我的问题是：

解决这个问题的最佳非机器学习算法是什么？
解决此问题的最佳机器学习算法是什么？

Answer 1

作为分类问题，它没有任何意义。您必须有许多具有相同标签的行，才能通过任何分类算法从数据中推导出某些内容。我可以建议通过将标签转换为唯一数字（使用字母表中的字母数字或类似的数字）将此问题转换为回归。然后，您可以使用任何回归算法来假设未标记数据的数量。最后，您可以将这些数字转回文本标签。我不确定这会有效，但你可以试试。

AA -> 0
AB -> 1
...
AZ -> 25
BA -> 1 * 26 + 0 = 26
...
ZZ -> 26 * 25 + 25

带有独特标签的监督学习（分类）

1 个答案: