如何在pyspark中使用udf从向量中提取值

时间:2019-07-11 20:38:50

标签: vector pyspark jupyter-notebook extract user-defined-functions

我无法在pyspark中使用UDF访问向量中的元素

我已经尝试过使用UDF,但是我无法提取正确的元素

代码:

from pyspark.sql.functions import udf
from pyspark.sql.types import FloatType

firstelement=udf(lambda v:float(v[0]),FloatType())
trainingData.select(firstelement('features')).show()

如何从(8255,[1496,3460 ....

0 个答案:

没有答案