我使用spark_read_csv将原始数据读取到Spark中,但是其中一个字段是字符?
“ 110,000.00”
我想将其转换为数字,因为它表示美元金额,但是很难正确解码吗?有办法吗?
答案 0 :(得分:1)
sparklyr
使用“ HIVE”语法check here,所有这些Hive函数都应在dplyr
动词中起作用,因此,要执行此特定的字符串转换,您需要使用类似{ {1}}
这是您问题的答案,我提供了详细信息,因此一切都很清楚
REGEXP_REPLACE
答案 1 :(得分:0)
一种可行的方法是使用stringr
包删除逗号,然后将字符串转换为数字。
library(stringr)
numbers <- c("100,000.00", "200,000.00")
numbers <- str_replace_all(numbers, ",", "")
numbers <- as.numeric(numbers)