我是Python的新手,我一直在这个博客中寻找答案,但是我什么也没找到(因此,这个问题可能被归类为主题外)。我希望你能帮助我。
我有一个这样的数据框:
MatchKey Height Weight Hair
Id1 1 0 0
Id2 0 1 1
Id3 0 0 0
Id4 0 1 1
Id5 1 1 1
Id6 0 1 1
Id7 1 1 0
Id8 0 1 0
Id9 1 1 1
此数据集未标记。 这些属性的值是:
Height: 1- Tall 0 - Short
Weight: 1 - Heavy 0 - Light
Hair: 1 - Long 0 - Short
我想生成一个完全随机的树,看起来可能像这样:
Hair
/ \
0 1
|
Weight
/ \
0 1
树节点包含属性的可能值:0或1 我该怎么办?
此外,一旦我生成了树,我想实现它(我的意思是:处理数据帧),以便生成一个名为"predValue"
的字段/列,其可能的值基于0或1。在树返回的值上?我该怎么办?
这是遗传算法的第一步,它将基于特定的适应度函数评估来选择最佳树。
我希望有人能帮助我。