在数据框中映射-pyspark

时间:2018-07-04 09:10:11

标签: apache-spark dataframe pyspark

在这里,我传递一个数据帧(CV_data)为决策树添加标记点

def labelData(data):
    # label: row[end], features: row[0:end-1]
    return data.map(lambda row: LabeledPoint(row[-1], row[:-1]))

m = labelData(CV_data)

给我错误

  

AttributeError:“ DataFrame”对象没有属性“ map”

需要帮助

0 个答案:

没有答案