我是R和因子分析的新手。我试图做的案例是在twitter上进行文本挖掘,并使用factanal函数将术语缩减为因子。 我设法检索推文,把它放在csv中,然后制作一个术语文档矩阵。
以下是我尝试的具体代码:
tweetsTestRaw<-read.csv(filename,header=T)
tweetsTest<-clean_text(tweetsTestRaw$text) #my custom text cleaning function
tweetsTest.corpus <- Corpus(VectorSource(as.vector(tweetsTest)))
tweetsTest.matrix <- t(TermDocumentMatrix(tweetsTest.corpus,control = list(wordLengths=c(4,Inf))));
d = as.matrix(tweetsTest.matrix)
d_stan = as.data.frame(scale(d))
res1a = factanal(d_stan, factors = 2, rotation = "varimax", na.action = na.omit) #error
以下是我的术语文档矩阵的一小部分:
执行factanal()函数后,它总是给出错误:
Error in solve.default(cv) :
Lapack routine dgesv: system is exactly singular: U[6,6] = 0
我通过互联网搜索此错误。没有人谈论在推文上使用因子分析。有些人在不同情况下谈论数据错误,但没有人为我提供解决方案。 我真的不懂因子分析。因此,如果有人建议我对数据做些什么,我希望你能提供如何做到的代码。