应用错误收集

我正在尝试使用RWeka的Discretize过滤器对一组数据进行离散化。我的数据集开始于超过一百万条记录，但返回的集合只有大约100k。该函数看起来应该返回集合中每个记录的bin，所以我很好奇90％的数据去了哪里？

数据中有NA，所以我尝试了以下内容：

> disc_data = Discretize(class~.,data=num_data, na.action=na.pass)
Error in .jarray(x) : java.lang.OutOfMemoryError: Java heap space

我正在处理其他人的代码，之前似乎没有问题。我不确定这是否缺乏对离散化或R的理解。任何人都可以解释Discretize如何工作以及发生了什么？