使用scala分割字符串,在逗号中用逗号和空格隔开

时间:2019-04-13 08:23:36

标签: string scala apache-spark

我正在尝试读取以下格式的文本文件

1980, Jan, Wednesday
1982, Feb, Monday
1987, March, Thursday

我尝试使用以下代码用逗号和空格分隔每个字符串:

val line = sc.textFile("file.txt") 
val lineMap = line.map(x => x.split("[,]+"))

但这给出了java.lang.ArrayIndexOutOfBoundsException

如何解决这个问题?

1 个答案:

答案 0 :(得分:2)

TLDR 使用:

val line = sc.textFile("file.txt") 
val lineMap = line.map(x => x.split(",\\s"))

请参阅:https://imgur.com/a/mi1waOa