如何将我从R中的文本挖掘中获得的termDocumentMatrix转换为excel或CSV文件?

时间:2013-06-07 10:11:31

标签: r machine-learning text-mining

更具体一点。假设我有一个带有以下元素的字符向量“名称”:

Names[1]<-"aaron, matt, patrick",
Names[2]<-"jiah, ron, melissa, john, patrick"

依旧......我有22956个这样的元素。我想分隔所有名称并在excel中为它们分配一个单独的列。 我该怎么做呢?它需要文本挖掘。但我不知道该怎么做。

谢谢。

2 个答案:

答案 0 :(得分:2)

假设TDM满足您的需要,您应该能够使用as.matrix函数将TDM对象强制转换为矩阵,然后照常导出到csv。

tdmMatrix <- as.matrix(myTDM)
write.csv(tdmMatrix, 'myfile.csv')

答案 1 :(得分:1)

我假设您有一个由逗号分隔的字符串元素列表,其中包含不同数量的元素。

Names <- c("aaron, matt, patrick",
           "jiah, ron, melissa, john, patrick")

## get max number of elements
mm <-  mm <- max(unlist(lapply(strsplit(Names,','),length)))
## set all rows the same length
lapply(strsplit(Names,','),function(x) {length(x) <- mm;x})
## create a data frame with the data welle formatted
res <- do.call(rbind,lapply(strsplit(Names,','),function(x) {length(x) <- mm;x}))
## save the file
write.csv(res,'output.csv')

我认为您也可以使用plyr包中的rbind.fill,但是您必须将每行强制为data.frame(特定费用)。