对于泰坦尼克数据集的分类变量,我使用一种热编码(我知道在这种情况下序数编码更好)。一个热编码成功完成。但是,模型拟合会引发以下错误:
ValueError:使用序列设置数组元素。
以下是我正在运行的代码:
{% assign textarea = settings.textarea | newline_to_br | split: '<br /> %}
{% for text_row in textarea %}
{% assign text_row_array = text_row | split: '|" %}
{% assign color_name = text_row_array[0] %}
{% assign color_hex = text_row_array[1] %}
...
{% endfor %}
如果我使用序数编码而不是One Hot,则会删除错误。我是处理类别变量的新手,所以无法弄清楚错误。