RWeka将结果透明化

时间:2013-05-21 21:54:42

标签: r discretization

我正在尝试使用RWeka的Discretize过滤器对一组数据进行离散化。我的数据集开始于超过一百万条记录,但返回的集合只有大约100k。该函数看起来应该返回集合中每个记录的bin,所以我很好奇90%的数据去了哪里?

数据中有NA,所以我尝试了以下内容:

> disc_data = Discretize(class~.,data=num_data, na.action=na.pass)
Error in .jarray(x) : java.lang.OutOfMemoryError: Java heap space

我正在处理其他人的代码,之前似乎没有问题。我不确定这是否缺乏对离散化或R的理解。任何人都可以解释Discretize如何工作以及发生了什么?

0 个答案:

没有答案