如何将图像数据的图像列提取到可以提供给Spark MLLib的功能中?
我正在尝试编写SparkML图像识别分类算法。我正在使用Spark 2.4.2,并将图像加载到具有架构类型为'image'的架构的DataFrame中。然后,我使用VectorAssembler将image列转换为'features'列,并使用transform方法获取DF。但是我得到一个错误 ““线程“主”中的异常” java.lang.IllegalArgumentException:不支持列图像的数据类型结构。”
Scala
val assembler = new VectorAssembler()
.setInputCols(Array("image"))
.setOutputCol("features")
val outputlearn = assembler.transform(learnDF)
我期望带有struct类型的image列的DF转换为vector类型的“功能”列。如果不可能,是否有其他方法可以实现?