如何将CSV文件转换为SVM以进行ML培训

时间:2017-12-21 09:29:09

标签: python csv pyspark svm naivebayes

我有这个数据集我希望在Apache Spark 2.1.1中训练多个ML模型。它由10列组成,其中2列包含字符串。删除这些列不是一种选择,因为它们对我希望收集的信息至关重要。但是,由于此问题,我无法将CSV文件转换为SVM以继续进行实验。

我尝试将其转换为RDD,然后成功保存为SVM,但文件永远不会保存。还有其他方法吗?

1 个答案:

答案 0 :(得分:0)

您可以在相关的两列中创建两个字符串数组,并使用索引作为要素(而不是使用字符串值)来训练您的模型。