我需要使用R将文本数据(例如,段落)转换为数据帧(以另存为csv文件)。具体的需求是,将每个段落中的每个单词放在一列中的单独单元格中。以下代码将文本转换为表格,但将单词放在单个单元格的每一行中。您能否帮助在单个单元格中创建每个单词的单列数据集?
merchant <- read.delim("merchant.txt")
write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)
答案 0 :(得分:0)
这是我基于tidyverse的尝试。不用读为表格,而是读为字符串,然后分成单个单词的向量:
library(tidyverse)
## Read in text file as string
merchant <- read_file("merchant.txt") %>%
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]
要将其转换为数据框:
para <- as.data.frame(para)