将文本数据转换为表格/ CSV格式

时间:2018-12-06 12:38:31

标签: r csv export-to-csv csvtotable

我需要使用R将文本数据(例如,段落)转换为数据帧(以另存为csv文件)。具体的需求是,将每个段落中的每个单词放在一列中的单独单元格中。以下代码将文本转换为表格,但将单词放在单个单元格的每一行中。您能否帮助在单个单元格中创建每个单词的单列数据集?

    merchant <- read.delim("merchant.txt")
    write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)

1 个答案:

答案 0 :(得分:0)

这是我基于tidyverse的尝试。不用读为表格,而是读为字符串,然后分成单个单词的向量:

library(tidyverse)

## Read in text file as string
merchant <- read_file("merchant.txt") %>% 
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]

要将其转换为数据框:

para <- as.data.frame(para)