标签: apache-spark
我有一个数据框。我有一栏正在声明,例如“在ABC公司工作25天”。我需要提取“ 25天”并将其放在新列中。我正在使用scala与spark。有什么建议?
答案 0 :(得分:1)
df.withColumn("working_days", regexp_extract(col("statement"), """\d* days?""", 0)) .where(length(col("working_days")) > 0)