Spark:读取实木复合地板文件时出现问题

时间:2018-08-01 19:07:27

标签: apache-spark apache-spark-sql parquet

读取任何实木复合地板文件时出现以下异常:

org.apache.spark.sql.AnalysisException: Illegal Parquet type: FIXED_LEN_BYTE_ARRAY;
at org.apache.spark.sql.execution.datasources.parquet.ParquetSchemaConverter.illegalType$1(ParquetSchemaConverter.scala:126)
at org.apache.spark.sql.execution.datasources.parquet.ParquetSchemaConverter.convertPrimitiveField(ParquetSchemaConverter.scala:193)

在apache spark的回购中找到了关于此的请求请求: https://github.com/apache/spark/pull/20826

该如何解决?

1 个答案:

答案 0 :(得分:1)

我同意这很烦人。我们只是将其序列化为String,但我同意这是一个穷人的解决方案。