我有这种格式的csv:
doy|uuid|gender|conf|age_range|cat1|cat1score|cat2|cat2score|cat3|cat3score|main_hour_range|main_location|
为了计算svd,我需要一个RowMatrix
val mat:RowMatrix = ... 我应该用这样的东西创造:
val inputData = sc.textFile("my.csv").map{ line =>
val parts = line.split("\t")
(parts(0).toLong, parts(1).toInt, parts(2).toDouble...)
}
这是我的问题: 我如何管理我的csv中具有字符串值的功能,考虑到我的矩阵向量需要由数值组成?
提前致谢