使用NGramTokenize时出错(lapply issue)

时间:2017-06-03 16:55:10

标签: r n-gram rweka

我正在使用rWeka软件包中的NGramTokenizer。我相信我已经正确安装了一切。我正在执行以下代码:

Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2))
tdm <- TermDocumentMatrix(corpus, control = list(tokenize= Bigram_Tokenizer()))

我收到的错误是:

Error in lapply(x,f): argument "x" is missing with no default.

有关如何解决此问题的任何想法?再次感谢。

最佳

维沙尔

1 个答案:

答案 0 :(得分:1)

您似乎在TermDocumentMatrix函数中执行Bigram_Tokenizer()而不是仅通过引用传递它。你需要在执行时传递它:

Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2))
tdm <- TermDocumentMatrix(corpus, control = list(tokenize= Bigram_Tokenizer))