如何将文本列拆分为包含所有行的列表?

时间:2017-04-26 11:05:20

标签: r

我有一个包含不同行中单词的数据框列:

**Word**
Word1
Word2
Word3

但我想要一个其他明智的列表

    list <- C("Word1","Word2","Word3"...)

我确信有一种快速而简单的方法可以做到这一点,我只是无法弄明白。

以下代码可以正常使用:

myCorpus = Corpus(VectorSource(master$Content))
#master$Content is nothing but a text column with statements as entries.

myTDM = TermDocumentMatrix(myCorpus, control = list(minWordLength = 3))

words <- C("Word1","Word2","Word3")
corr <- c(0.7, 0.75, 0.1)

# returns a list
my_assocs <- findAssocs(myTDM, words, corr)

但是当我尝试从Dataframe列中创建单词列表并重新运行findAssocs时它不起作用。

我收到此错误:

> my_assocs <- findAssocs(myTDM, as.list(wordlist[,1]), corr)
Error: is.character(terms) is not TRUE

1 个答案:

答案 0 :(得分:0)

如果我们需要list,请在列

上使用as.list
as.list(df1$Word)

否则,如果是vector,则可以使用其中一个选项

df1$Word
df1[["Word"]]
df1[, "Word"]