使用多种功能的机器学习 - 文本处理

时间:2018-03-27 20:15:06

标签: machine-learning nlp text-processing feature-extraction feature-engineering

我有以下数据:

col1   col2   col3
 2      14    text, text, some text

我经历了http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing,但我只能找到矢量化col3的信息并传递给它进行分类。在我的场景中,我在col1和col2中也有数字信息。

如果没有矢量化,我会传递col1,2和3,因为它是String,我会收到col3的错误。

如果我对col3进行矢量化,则输出是稀疏矩阵。我需要将col1和col2添加到矢量化数据中。我该怎么做?

我正在使用scikit-learn。

0 个答案:

没有答案
相关问题