我有一个非常大的文件,大约10GB。我无法将其加载到内存中,因此我设法将其传输到.mat文件。但是当我尝试群集时,“内存不足”的问题仍然存在。我认为它的最终解决方案就是把那些内存放到磁盘上。但我需要从matlab调用kmeans()方法。有没有办法将kmeans中的局部变量放到磁盘上而不重写方法?
答案 0 :(得分:0)
当你加载数据时,它首先被加载到你的计算机的RAM内存中,所以我认为你问题的唯一最终解决方案是拥有16GB的RAM。
答案 1 :(得分:0)
您需要一种策略来处理大型数据集。可能性是:
答案 2 :(得分:0)
如果数据不是高度非线性的,您可以尝试对数据进行下采样。如果您有兴趣,可以阅读参考http://www.mathworks.com/help/signal/ref/downsample.html
例如,您可以获取数据,按比例缩小= 4,然后您将获得2.5GB的数据。你可以走得更远,但会增加错误。处理完毕后,您可以使用不同的技术对数据进行上采样(Matlab具有所有内置功能)。很抱歉,我不知道您的数据类型,所以如果我的答案与您的问题不符,抱歉。