将文本分组到R中的桶中

时间:2017-08-28 17:06:51

标签: r text-mining logistic-regression text-analysis

我们正在进行一项调查,我们从数字/分类响应中得到一些开放式答案。到目前为止,我们曾经手动将这些文本分类为10-15个桶,以便营销团队可以对其进行操作例如,如果被访者被问及他正在使用的特定平板电脑中他想要的其他功能,我们会将他/她的回复分组到诸如“更好的安全功能”等桶中,更好的支持'等。

不是手动完成,而是通过为每个桶创建单独的逻辑回归/ CART /随机森林方程来实现自动化。例如,对于桶1,使用代码

model1=glm(Better.support~.,data=verbatimSparse,family=binomial)
verbatim$predict1=predict(model1,type="response")

我正在构建其他12个这样的模型,每个响应将被分组到预测概率最高的桶中。这有点符合我的目的,但准确率只有80%左右。还有其他方法吗?更好地对文本进行分类。

0 个答案:

没有答案