我想显示我在语料库中有400多个文档的全部(或部分)文本内容。为此,我使用了函数writeLines
,但它没有返回文档中包含的实际文本,而是返回:
列表(list = content("",""),meta = list(author = character(0),atetimestamp = list(sec = 33.0082728862762,min = 22,小时= 12,mday = 5,mon = 8,年= 116,wday = 1,yday = 248,isdst = 0),描述=字符(0),标题......
这就是我编码的方式:
library(tm)
library(SnowballC)
#Partition each cell in Excel into separate document
textdata <- read.csv("C:/Users/biat/Documents/survey/openanswers.csv", header = FALSE)
require(tm)
doc <- Corpus(DataframeSource(textdata), readerControl = list(language="swedish"))
writeLines(as.character(doc))
问题出在R代码还是CSV文件中?当我将writeLines
与DirSource
一起使用时,它会返回文本。任何人都知道如何抑制它返回的信息以及如何只检索文档中的文本?
答案 0 :(得分:0)
尝试以下方法将文本打印到您的控制台,如果我理解的话,这就是您要求的内容?
library(tm)
data("crude") # example set from tm
output <- sapply( crude, function(x) x$content) #get the content from your object
cat(output) # have your text outputted
ps:尝试为您的问题提供可重复的示例