当我将R
的西班牙语文本转换为语料库时,尽管可以向我返回以下警告,但我可以在stemDocument
函数中应用tm_map
:
Warning message:
In tm_map.SimpleCorpus(col, stemDocument, "spanish") :
transformation drops documents
我正在尝试使用VCorpus代替语料库。它没有向我显示任何警告消息,但阻止也无法正常进行。
col <- tm::VCorpus(VectorSource('patinetes eléctricos y bicicletas'))
col <- tm::tm_map(col, stemDocument, 'spanish')
col[[1]]$content
[1] "patinet eléctrico y bicicleta"
当我使用stemDocument('patinetes eléctricos y bicicletas', 'spanish')
时,结果是:
"patinet electr y biciclet"