writeLines不返回文本

时间:2016-09-05 12:34:16

标签: r text-mining tm data-science

我想显示我在语料库中有400多个文档的全部(或部分)文本内容。为此,我使用了函数writeLines,但它没有返回文档中包含的实际文本,而是返回:

  

列表(list = content("",""),meta = list(author = character(0),atetimestamp = list(sec = 33.0082728862762,min = 22,小时= 12,mday = 5,mon = 8,年= 116,wday = 1,yday = 248,isdst = 0),描述=字符(0),标题......

这就是我编码的方式:

library(tm)
library(SnowballC)

#Partition each cell in Excel into separate document
textdata <- read.csv("C:/Users/biat/Documents/survey/openanswers.csv", header = FALSE)
require(tm)

doc <- Corpus(DataframeSource(textdata), readerControl = list(language="swedish"))

writeLines(as.character(doc))

问题出在R代码还是CSV文件中?当我将writeLinesDirSource一起使用时,它会返回文本。任何人都知道如何抑制它返回的信息以及如何只检索文档中的文本?

1 个答案:

答案 0 :(得分:0)

尝试以下方法将文本打印到您的控制台,如果我理解的话,这就是您要求的内容?

library(tm)
data("crude") # example set from tm
output <- sapply( crude, function(x) x$content) #get the content from your object
cat(output) # have your text outputted

ps:尝试为您的问题提供可重复的示例