具有不同答案长度的文本挖掘响应

时间:2019-01-04 13:55:06

标签: text nlp analytics sentiment-analysis udpipe

我有一个响应数据集,要求人们回答一组问题。只有一列文本数据要处理。

我的挑战是;实际上,只有极少数的受访者撰写过很长的文章,这些文章很容易处理并从中获得见识。通常会发现其他大多数响应都很短,例如“ Somewhat”,“ Yes”,“ No”,“ Larger range”。同样,由于没有逻辑顺序,因此无法按比例缩放它。

我已经能够使用更长的文本回复来获得对情感的见解,提取关键词和短语并应用机器学习(例如RAKE和PMI)。我在R中使用了UDPIPE库。

但是,对于较短的“几个字”答复,我发现从这些消息中获得真知灼见确实很困难。

我当前遇到的问题还有其他机器学习技术吗?还是我需要尝试任何NLP技术?

0 个答案:

没有答案