我有以下数据:
col1 col2 col3
2 14 text, text, some text
我经历了http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing,但我只能找到矢量化col3的信息并传递给它进行分类。在我的场景中,我在col1和col2中也有数字信息。
如果没有矢量化,我会传递col1,2和3,因为它是String,我会收到col3的错误。
如果我对col3进行矢量化,则输出是稀疏矩阵。我需要将col1和col2添加到矢量化数据中。我该怎么做?
我正在使用scikit-learn。