如何从数据框中的特殊列创建多个文件.txt

时间:2015-05-14 06:04:32

标签: r write.table

我的数据框包含2列,DOCS和TEXT

DOCS    TEXT
1   tanaman jagung seumur jagung 
2   tanaman jagung kacang ketimun rusak dimakan kelinci 
3   ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan 
4   ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan 
5   ladang diserbu kelinci tanaman jagung kacang ketimun rusak 

我想创建多个文件.txts和id的数量以及包含不同内容的每个文件(每1个txt文件在TEXT列中包含1行文本)。所以,如果我有5个Docs-> 5个文件.txt,内容不同

我已经尝试过这段代码

for (j in 1:nrow(dataframe)) {
         mytitle <- format("docs")
         myfile <- file.path(getwd(), paste0(mytitle, "_", j, ".txt"))
         write.table(dataframe$TEXT, file = myfile, sep = "", row.names = FALSE, col.names = FALSE,
                     quote = FALSE, append = FALSE)
        }

但是,结果包含5个file.txt,其中每个文件具有相同的内容,其中包含“TEXT”列中的所有行。

2 个答案:

答案 0 :(得分:0)

每个文件包含相同的原因是您每次都要编写整个TEXT列。以下代码生成5个不同的文件:

 for (i in 1:nrow(dataframe)) {
       myfile <- file.path(paste0("docs_", i, ".txt"))
       file.cont <- strsplit(dataframe$TEXT[i]," ")
       write.table(file.cont, file = myfile, sep = "", row.names = FALSE,
                   col.names = FALSE, quote = FALSE)
 }

如您所见,我通过从数据框(i)中选择dataframe$TEXT[i]行来创建文件内容。然后我使用strsplit将字符串分成几个字符串。这可以确保每个单词都打印在自己的行上。

另外,我创建的文件名与您不同。我不明白你对format()的使用。我把所有东西都放在一行。无需在路径中包含getwd(),因为无论如何R都会写入您的工作目录。

答案 1 :(得分:0)

我建议您尝试以下操作,而不是使用可能让您感到困惑的for循环

# Create a data frame 
DOCS <- c(1:5)
TEXT <- c("tanaman jagung seumur jagung " , 
          "tanaman jagung kacang ketimun rusak dimakan kelinci" , 
          "ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan" , 
          "ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan" , 
          "ladang diserbu kelinci tanaman jagung kacang ketimun rusak ")

df <- data.frame(DOCS , TEXT , Test)

# Convert to matrix 
M <- as.matrix(df)

# Create a function that will write every single file
write_file <- function(file){
  my_title <- format("docs")  
  file_name <- file.path(paste0( my_title , "_" , file[1] , ".txt"))
  file_content <- file[2]
  write.table(file_content , file = file_name , append = F , row.names = F 
  , col.names = F , quote = F)

}

# Use the apply function to pass each row in matrix to the 
# function that creates every single file

apply(M , 1 , write_file)