如何将图像DF的图像列转换为SparkML可以处理的内容

时间:2019-05-08 12:21:22

标签: apache-spark-mllib

如何将图像数据的图像列提取到可以提供给Spark MLLib的功能中?

我正在尝试编写SparkML图像识别分类算法。我正在使用Spark 2.4.2,并将图像加载到具有架构类型为'image'的架构的DataFrame中。然后,我使用VectorAssembler将image列转换为'features'列,并使用transform方法获取DF。但是我得到一个错误 ““线程“主”中的异常” java.lang.IllegalArgumentException:不支持列图像的数据类型结构。”

Scala
val assembler = new VectorAssembler()
                   .setInputCols(Array("image"))
                   .setOutputCol("features")

val outputlearn = assembler.transform(learnDF)

我期望带有struct类型的image列的DF转换为vector类型的“功能”列。如果不可能,是否有其他方法可以实现?

0 个答案:

没有答案