应用错误收集

如何将图像数据的图像列提取到可以提供给Spark MLLib的功能中？

我正在尝试编写SparkML图像识别分类算法。我正在使用Spark 2.4.2，并将图像加载到具有架构类型为'image'的架构的DataFrame中。然后，我使用VectorAssembler将image列转换为'features'列，并使用transform方法获取DF。但是我得到一个错误 ““线程“主”中的异常” java.lang.IllegalArgumentException：不支持列图像的数据类型结构。”

Scala
val assembler = new VectorAssembler()
                   .setInputCols(Array("image"))
                   .setOutputCol("features")

val outputlearn = assembler.transform(learnDF)

我期望带有struct类型的image列的DF转换为vector类型的“功能”列。如果不可能，是否有其他方法可以实现？

如何将图像DF的图像列转换为SparkML可以处理的内容

0 个答案: