我无法在pyspark中使用UDF访问向量中的元素
我已经尝试过使用UDF,但是我无法提取正确的元素
代码:
from pyspark.sql.functions import udf
from pyspark.sql.types import FloatType
firstelement=udf(lambda v:float(v[0]),FloatType())
trainingData.select(firstelement('features')).show()
如何从(8255,[1496,3460 ....