从R中的数据帧列表创建(tm)语料库列表

时间:2017-04-21 11:30:10

标签: r tm

我有一个数据帧列表,它们都具有相同的结构:2列,第一列由字符串组成。我想循环遍历此列表中的数据帧,以基于这些第一列创建相同长度的tm语料库列表。这是一些复制数据:

library(tm)
d1 <- data.frame(y1=c("text 1","text 2","text 3"),y2=c(1, 2, 3))
d2 <- data.frame(y1=c("text 4","text 5","text 6"),y2=c(4, 5, 6))
d3 <- data.frame(y1=c("text 7","text 8","text 9"),y2=c(7, 8, 9))
my.list <- list(d1, d2, d3)

到目前为止,我已经提出了以下代码,但这只是将每个数据帧的第一列中的值作为字符串返回:

my.corplist <- as.list(1:3)

for (i in seq_along(my.list)) {
  my.corplist[i] <- Corpus(VectorSource((my.list[[i]][,1])))
}

我做错了什么?

0 个答案:

没有答案