我正在尝试使用Spark CLI读取excel文件,但是却收到“ org.apache.poi.openxml4j.exceptions.InvalidFormatException:您的InputStream既不是OLE2流,也不是OOXML流”错误。
以下是我的Excel工作表中显示的数据:
Id Name City
1 Amit Panji
2 Sharma Mumbai
3 Kumar Pune
4 Abhay Delhi
5 Rohit Gurgaon
以下是我正在使用的代码:
import com.crealytics.spark.excel
val df = spark.read.format("com.crealytics.spark.excel")
.option("useHeader", "true")
.option("startColumn", 0)
.option("treatEmptyValuesAsNulls", "false")
.option("inferSchema", "false")
.option("location", "/home/Desktop/lucky/logs.xlsx")
.option("addColorColumns", "False")
.load()
答案 0 :(得分:0)
您使用的是哪个Excel版本?
Apache POI网站说:
Apache POI is your Java Excel solution (for Excel 97-2008)
Apache POI网站:https://poi.apache.org/