我正在研究Spark中的分类问题,其中示例的数据集基于一组历史特征构建。 该问题与网络管理有关,目的是在设备的日常运行期间发现故障。对于每个DeviceID,每个DeviceID都有一个表示其日常操作的“向量”的时间序列。是否有可能建立一个“特征矩阵”,以便根据历史特征而不是简单的特征向量来获得“标记点”? (抱歉我的英文...)
答案 0 :(得分:0)
否:因为LabeledPoint
构造函数的签名是明确的:
new LabeledPoint(label: Double, features: Vector)
Vector
而不是Matrix
。
是:每个矩阵都可以很容易地表示为一维向量,并且没有一个算法关注特定要素的含义(有些算法虽然考虑了声明的类型)。