我使用 ID3 决策树时如何处理这些数据?

时间:2021-03-25 04:51:57

标签: python decision-tree data-preprocessing

所以我的数据集是这样的:

    A                                                   B
0   AAABBABAABBAAABBBBAABBBABAAABAAAAABBBABBBAAABB...   True
1   AABAABABBBABAAAAABAAABBAABAABBABABBAAABABBBBAB...   True
2   BAAABBBBABABABBBABBAAABAAAAAAABBBBAABABABBBAAB...   True
3   BAABBABBABBAAAABABBBAAAAAAAABAAABBAAAABBAABBAA...   True
4   ABBABBBABBAABAABABBAAABAAAAABABABAABBAABBBAABA...   True

我已经把它处理成这样:


   0  1  2     B
0  A  B  B  True
1  A  B  B  True
2  A  B  B  True
3  A  B  B  True
4  A  B  B  True

如果我使用 ID3 作为决策树,我应该如何处理我的数据?

这里的 1 行包含 100 个 As 或 B,因此有 100 个特征。

0 个答案:

没有答案