我正在尝试使用RWeka的Discretize
过滤器对一组数据进行离散化。我的数据集开始于超过一百万条记录,但返回的集合只有大约100k。该函数看起来应该返回集合中每个记录的bin,所以我很好奇90%的数据去了哪里?
数据中有NA,所以我尝试了以下内容:
> disc_data = Discretize(class~.,data=num_data, na.action=na.pass)
Error in .jarray(x) : java.lang.OutOfMemoryError: Java heap space
我正在处理其他人的代码,之前似乎没有问题。我不确定这是否缺乏对离散化或R的理解。任何人都可以解释Discretize
如何工作以及发生了什么?