我有两个LabeledPoints
- lable1
和label2
:
label1 = (label,[feature1,feature2,feature3])
label2 = (label,[feature4,feature5])
label
中的LabeledPoints
列都相同,我想形成一个新的LabeledPoint
,其中两个feature
列中的LabeledPoints
列连在一起:
label_new = (label,[feature1,feature2,feature3,feature4,feature5])
如何将两个LabeledPoints
一起添加?
答案 0 :(得分:2)
正如您在PySpark
的{{3}}文档中所看到的,LabeledPoint
对象有两个属性label
和features
,因此我们可以使用{实现此目的的{1}}属性。
features
注意,您必须注意标签值!他们可能会有所不同。