如何在String中第n个分隔符出现之前删除所有数据?

时间:2018-05-31 23:47:48

标签: scala apache-spark apache-spark-sql

我有一个用逗号分隔的字符串。我想在我的第二个逗号和逗号之前删除所有数据。例如:

Input: 1,2,3,4,5

Output: 3,4,5

1 个答案:

答案 0 :(得分:2)

只需定义一个执行此操作的UDF,即:

val dropTwoEntries = udf((s: String) => s.split(",").drop(2).mkString(","))
df.withColumn("output", dropTwoEntries(col("input")))