Question

我们正在进行一项调查，我们从数字/分类响应中得到一些开放式答案。到目前为止，我们曾经手动将这些文本分类为10-15个桶，以便营销团队可以对其进行操作例如，如果被访者被问及他正在使用的特定平板电脑中他想要的其他功能，我们会将他/她的回复分组到诸如“更好的安全功能”等桶中，更好的支持'等。

不是手动完成，而是通过为每个桶创建单独的逻辑回归/ CART /随机森林方程来实现自动化。例如，对于桶1，使用代码

model1=glm(Better.support~.,data=verbatimSparse,family=binomial)
verbatim$predict1=predict(model1,type="response")

我正在构建其他12个这样的模型，每个响应将被分组到预测概率最高的桶中。这有点符合我的目的，但准确率只有80％左右。还有其他方法吗？更好地对文本进行分类。

将文本分组到R中的桶中

0 个答案: