SparkR中的Cut()函数的等价物

时间:2016-04-20 16:27:32

标签: r sparkr

我正在尝试创建一个包含另一列中数值的“桶”的变量。例如:

nts$size_bucket<-cut(nts$loansize, c(0, 5000,10000, 25000,50000,100000,200000,300000, 500000,Inf),
            c('<$5K', '5-10K', '10-25K', '25-50K', '50-100K', '100-200K', '200-300K', '300-500K', '500K+'))

在正常的R中,cut可以完美地工作,但它似乎不适用于SparkR数据帧并且给出例外:

'x' must be numeric

即使x是数字。

有关如何在SparkR中完成此任务的任何建议吗?

谢谢!

0 个答案:

没有答案