Google N-gram BerkeleyLM赋予Nan价值观

时间:2019-01-14 21:08:43

标签: language-model

我正在尝试将google-Ngram LM binary provided hereberkeleylm一起使用。按照使用说明进行操作后,我在构建程序包后运行以下命令:

java -ea -mx10000m -server -cp ../src edu.berkeley.nlp.lm.io.ComputeLogProbabilityOfTextStream -g vocab_cs.gz eng.blm.gz <file to be scored>

我从提供的链接中检索了vocab_cs.gzeng.blm.gz。但是,即使对于像nan这样的非常简单的句子,我也能获得"This is a sample sentence"的价值。我尝试从eng.blm提取eng.blm.gz并使用提取的二进制代码运行代码,但仍然得到相同的结果。请帮我调试一下。

0 个答案:

没有答案