应用错误收集

如何在pyspark中使用udf从向量中提取值

时间：2019-07-11 20:38:50

标签： vector pyspark jupyter-notebook extract user-defined-functions

我无法在pyspark中使用UDF访问向量中的元素

我已经尝试过使用UDF，但是我无法提取正确的元素

代码：

from pyspark.sql.functions import udf
from pyspark.sql.types import FloatType

firstelement=udf(lambda v:float(v[0]),FloatType())
trainingData.select(firstelement('features')).show()

如何从（8255，[1496,3460 ....

0 个答案:

没有答案