如果Excel文件是我在databricks中的源文件,如何创建数据框

时间:2019-05-07 09:29:35

标签: scala apache-spark

我有一个excel文件作为源文件,我想从excel文件读取数据并使用databricks将数据转换为数据帧。我是Scala编码的新手。

val df = spark.read.format("com.crealytics.spark.excel")
.option("location", "/FileStore/tables/Airline.xlsx") 
.option("useHeader","true")
.option("treatEmptyValuesAsNulls", "false") 
.option("inferSchema","false")
.option("addColorColumns", "false") 
.load("/FileStore/tables/Airline.xlsx") 

1 个答案:

答案 0 :(得分:0)

您可以使用可用的Excel插件:

nil

按照https://github.com/crealytics/spark-excel中的示例构建数据框。