我有一个包含不同行中单词的数据框列:
**Word**
Word1
Word2
Word3
但我想要一个其他明智的列表
list <- C("Word1","Word2","Word3"...)
我确信有一种快速而简单的方法可以做到这一点,我只是无法弄明白。
以下代码可以正常使用:
myCorpus = Corpus(VectorSource(master$Content))
#master$Content is nothing but a text column with statements as entries.
myTDM = TermDocumentMatrix(myCorpus, control = list(minWordLength = 3))
words <- C("Word1","Word2","Word3")
corr <- c(0.7, 0.75, 0.1)
# returns a list
my_assocs <- findAssocs(myTDM, words, corr)
但是当我尝试从Dataframe列中创建单词列表并重新运行findAssocs时它不起作用。
我收到此错误:
> my_assocs <- findAssocs(myTDM, as.list(wordlist[,1]), corr)
Error: is.character(terms) is not TRUE
答案 0 :(得分:0)
如果我们需要list
,请在列
as.list
as.list(df1$Word)
否则,如果是vector
,则可以使用其中一个选项
df1$Word
df1[["Word"]]
df1[, "Word"]