我正在尝试编写一些代码,以将Mallet实例列表文件放入R中的文档主题矩阵中。为此,我将实例列表文件读入一个名为“ topic.model”的主题训练器变量中。下面是我要在R中创建文档主题矩阵的函数调用:
theta <- mallet::mallet.doc.topics(topic.model, smoothed = TRUE, normalized = TRUE)
我在较小的实例列表文件(<1gb)上执行此操作,但对于较大的实例列表文件(〜15gb),我收到以下错误:
.jcall(包装器,“ [D”,“ flat_double”)中的错误:
java.lang.NegativeArraySizeException
调用:myfunc ... .jevalArray-> newArray->结构-> .jcall-> .jcheck
执行停止
我怀疑整数溢出会超出INT_MAX
,并且发生NegativeArraySizeException
。有趣的是,使用命令行,Mallet
可以使用--output-doc-topics
参数(> 150gb)制作文档主题文件。任何建议将不胜感激。