是否可以从“特征矩阵”而不是特征向量在Spark中构建带标签的点?

时间:2016-03-24 10:06:21

标签: apache-spark

我正在研究Spark中的分类问题,其中示例的数据集基于一组历史特征构建。 该问题与网络管理有关,目的是在设备的日常运行期间发现故障。对于每个DeviceID,每个DeviceID都有一个表示其日常操作的“向量”的时间序列。是否有可能建立一个“特征矩阵”,以便根据历史特征而不是简单的特征向量来获得“标记点”? (抱歉我的英文...)

1 个答案:

答案 0 :(得分:0)

:因为LabeledPoint构造函数的签名是明确的:

new LabeledPoint(label: Double, features: Vector) 

Vector而不是Matrix

:每个矩阵都可以很容易地表示为一维向量,并且没有一个算法关注特定要素的含义(有些算法虽然考虑了声明的类型)。