如何使用stemCompletion函数(TM软件包)从词典中完成词干语料库

时间:2019-05-31 15:49:49

标签: r tm stemming

我正在使用tm包对修复数据进行文本分析,将数据读取到数据框中,转换为语料库对象,并应用了各种方法来使用Lower,stipWhitespace,removestopwords等清除数据。

取回Corpus对象进行stemCompletion。

使用tm_map函数执行stemDocument,我的目标词被阻止了

获得预期的结果。

当我使用tm_map函数运行stemCompletion操作时,它无法正常工作并出现错误

  

corp <-VCorpus(VectorSource(ccm_1 $ abstract))

     

corp   元数据:特定语料库:0,文档级别(索引):0   内容:文件:644

     

corp1 <-tm_map(corp,stemDocument)

     

corp2 <-tm_map(corp1,content_transformer(stemCompletion),字典= corp,惰性= TRUE)

     

corp2 [[3]] $ content

     

[1]不适用

如何解决此错误?

0 个答案:

没有答案