标签: scala apache-spark apache-spark-sql
我有一个用逗号分隔的字符串。我想在我的第二个逗号和逗号之前删除所有数据。例如:
Input: 1,2,3,4,5 Output: 3,4,5
答案 0 :(得分:2)
只需定义一个执行此操作的UDF,即:
val dropTwoEntries = udf((s: String) => s.split(",").drop(2).mkString(",")) df.withColumn("output", dropTwoEntries(col("input")))