用于跳过空行的DataFrameReadercsv(path:String)选项

时间:2017-04-18 15:25:25

标签: sql apache-spark spark-dataframe

确实

org.apache.spark.sqlDataFrameReadercsv(path: String) 

有跳过空白行的选项吗?特别是一个空行作为最后一行?

1 个答案:

答案 0 :(得分:1)

您可以尝试将mode设置为"DROPMALFORMED",如下所示:

val df = sqlContext.read.format("com.databricks.spark.csv").option("mode", "DROPMALFORMED")...

Python

df = sqlContext.read.format('com.databricks.spark.csv').options(mode = "DROPMALFORMED")...

根据documentation

  

" ...删除比预期更少或更多令牌的行。"