我正在尝试创建一个包含另一列中数值的“桶”的变量。例如:
nts$size_bucket<-cut(nts$loansize, c(0, 5000,10000, 25000,50000,100000,200000,300000, 500000,Inf),
c('<$5K', '5-10K', '10-25K', '25-50K', '50-100K', '100-200K', '200-300K', '300-500K', '500K+'))
在正常的R中,cut可以完美地工作,但它似乎不适用于SparkR数据帧并且给出例外:
'x' must be numeric
即使x是数字。
有关如何在SparkR中完成此任务的任何建议吗?
谢谢!