如何从spark-sql中的字符串中删除特定字符

时间:2017-06-01 06:50:27

标签: sql apache-spark-sql

我想通过spark-sql将'123,456'转换为123456(字符串为int)。

我试过这样。

REPLACE('123,456', ',', '')

但它不起作用,因为spark-sql不允许REPLACE()

2 个答案:

答案 0 :(得分:1)

假设所有数据都是数字,而存储在varchar转换函数中应解决您的问题

conv(Column num,
          int fromBase,
          int toBase)

答案 1 :(得分:1)

replace对我来说工作正常(火花2.3.0):

spark.sql("select int(replace('123,456', ',', '')) result").collect()
# [Row(result=123456)]