我的数据框包含2列,DOCS和TEXT
DOCS TEXT
1 tanaman jagung seumur jagung
2 tanaman jagung kacang ketimun rusak dimakan kelinci
3 ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan
4 ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan
5 ladang diserbu kelinci tanaman jagung kacang ketimun rusak
我想创建多个文件.txts和id的数量以及包含不同内容的每个文件(每1个txt文件在TEXT列中包含1行文本)。所以,如果我有5个Docs-> 5个文件.txt,内容不同
我已经尝试过这段代码
for (j in 1:nrow(dataframe)) {
mytitle <- format("docs")
myfile <- file.path(getwd(), paste0(mytitle, "_", j, ".txt"))
write.table(dataframe$TEXT, file = myfile, sep = "", row.names = FALSE, col.names = FALSE,
quote = FALSE, append = FALSE)
}
但是,结果包含5个file.txt,其中每个文件具有相同的内容,其中包含“TEXT”列中的所有行。
答案 0 :(得分:0)
每个文件包含相同的原因是您每次都要编写整个TEXT列。以下代码生成5个不同的文件:
for (i in 1:nrow(dataframe)) {
myfile <- file.path(paste0("docs_", i, ".txt"))
file.cont <- strsplit(dataframe$TEXT[i]," ")
write.table(file.cont, file = myfile, sep = "", row.names = FALSE,
col.names = FALSE, quote = FALSE)
}
如您所见,我通过从数据框(i
)中选择dataframe$TEXT[i]
行来创建文件内容。然后我使用strsplit
将字符串分成几个字符串。这可以确保每个单词都打印在自己的行上。
另外,我创建的文件名与您不同。我不明白你对format()
的使用。我把所有东西都放在一行。无需在路径中包含getwd()
,因为无论如何R都会写入您的工作目录。
答案 1 :(得分:0)
我建议您尝试以下操作,而不是使用可能让您感到困惑的for循环
# Create a data frame
DOCS <- c(1:5)
TEXT <- c("tanaman jagung seumur jagung " ,
"tanaman jagung kacang ketimun rusak dimakan kelinci" ,
"ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan" ,
"ladang diserbu kelinci tanaman jagung kacang ketimun rusak dimakan" ,
"ladang diserbu kelinci tanaman jagung kacang ketimun rusak ")
df <- data.frame(DOCS , TEXT , Test)
# Convert to matrix
M <- as.matrix(df)
# Create a function that will write every single file
write_file <- function(file){
my_title <- format("docs")
file_name <- file.path(paste0( my_title , "_" , file[1] , ".txt"))
file_content <- file[2]
write.table(file_content , file = file_name , append = F , row.names = F
, col.names = F , quote = F)
}
# Use the apply function to pass each row in matrix to the
# function that creates every single file
apply(M , 1 , write_file)