使用拆分函数省略空字段 - Spark Scala

时间:2017-06-20 17:23:07

标签: scala apache-spark

我与Spark和Scala的世界互动。

我有一个包含以下数据的文件:

1.1|AGDT970HH|02|2011|N|||||
110000000000|0.00|0.00|0.00|1485976093.32|
110100000000|0.00|0.00|0.00|248871036.86|
110200000000|0.00|0.00|0.00|229610905.15|
110201000000|0.00|0.00|0.00|256660759.36|
110202000000|0.00|0.00|0.00|234105514.15|
110203000000|0.00|0.00|0.00|-261155368.36|
110300000000|0.00|0.00|0.00|280990.61|

与其他行相比,文件的第一行始终具有不同的布局。

出于这个原因,我想给它一个不同的处理方式,所以我试着得到第一行的值(包括空值):

val fileToRead = sc.textFile("FileName")
val firstRow = fileToRead.first.split("\\|")

但是当我的 firstRow 字段被创建时,它不包含空值: enter image description here

它只保存包含值的那些。

有谁知道如何保留这些空值?

1 个答案:

答案 0 :(得分:1)

你可以得到它  val firstRow = fileToRead.first.split("\\|", -1)