我正在使用文本挖掘来探索自然语言语料库中语音域中术语使用的差异。该研究将主要关注关键术语的分布。有哪些适当且有效的方式可视化地呈现此类信息?
答案 0 :(得分:1)
许多文本挖掘方法都围绕单,双和三词对的出现频率-特别是在进行探索性数据分析时。因此,您可以依靠条形图/柱形图,直方图。如果字云不太稠密或克不太多,则很有用。
如果您在谈论ML结果,那么您可能会更少地依赖可视化,而更多地依赖于预测和系数。
我刚刚为Coursera课做了一些探索性的文本分析: http://rpubs.com/polyoptik/coursera-capstone-milestone-report
很高兴进一步讨论,我发现这项工作令人兴奋。