读取excel时Spark错误:org.apache.poi.openxml4j.exceptions.InvalidFormatException

时间:2019-04-02 11:42:36

标签: excel apache-spark-sql

我正在尝试使用Spark CLI读取excel文件,但是却收到“ org.apache.poi.openxml4j.exceptions.InvalidFormatException:您的InputStream既不是OLE2流,也不是OOXML流”错误。

以下是我的Excel工作表中显示的数据:

Id  Name    City
1   Amit    Panji
2   Sharma  Mumbai
3   Kumar   Pune
4   Abhay   Delhi
5   Rohit   Gurgaon

以下是我正在使用的代码:

    import com.crealytics.spark.excel

    val df = spark.read.format("com.crealytics.spark.excel")
    .option("useHeader", "true")
    .option("startColumn", 0)
    .option("treatEmptyValuesAsNulls", "false")
    .option("inferSchema", "false")
    .option("location", "/home/Desktop/lucky/logs.xlsx")
    .option("addColorColumns", "False")
    .load()

1 个答案:

答案 0 :(得分:0)

您使用的是哪个Excel版本?

Apache POI网站说:

Apache POI is your Java Excel solution (for Excel 97-2008)

Apache POI网站:https://poi.apache.org/