语料库对象缺少文本

时间:2019-09-09 21:58:37

标签: r text-mining tm corpus

在R中使用“ tm”库。

使用此代码时:

abstract <- VectorSource(data$Abstract)

它起作用并给出以下结果:

[1] Accurate text...
[2] Accurate text...
[3] Accurate text...

然后将其转换为语料库对象,以便对其进行进一步的聚类分析。

abstract <- tm::Corpus(tm::VectorSource(data$Abstract)) 

在检查原始数据时,我发现当将其转换为数据帧时,它将行保存为NULL:

dataframe <- data.frame(text=unlist(sapply(abstract, `[`, "content")), 
                        stringsAsFactors=F)
text
1   NA
2   NA
3   NA
4   NA
5   NA
6   NA
7   NA
8   NA
Showing 1 to 8 of 23,600 entries, 1 total columns

所以我不知道如何将文本特别转换为语料库。

1 个答案:

答案 0 :(得分:0)

我将对此提出自己的问题:

writeLines(as.character(abstract[[1]]))
content(abstract[[1]])

但是仍然不知道如何获得完整的专栏。