对每条消息重复的文本消息进行分类(数据具有计数列)

时间:2018-06-06 01:33:10

标签: machine-learning nlp classification text-mining

我正在研究文本分类问题,该问题涉及将系统错误消息分为两类--A和B.数据中有三列:

第1列:系统错误消息

第2栏:A级或B级

第3列:出现错误消息的次数

我觉得伯爵很重要,但我不知道该怎么做。我遵循通常的步骤直到现在 - 清理数据,制作文档术语矩阵。有没有人对计数如何成为重要细节以及可以做些什么有任何建议?

0 个答案:

没有答案