标签: machine-learning nlp classification text-mining
我正在研究文本分类问题,该问题涉及将系统错误消息分为两类--A和B.数据中有三列:
第1列:系统错误消息
第2栏:A级或B级
第3列:出现错误消息的次数
我觉得伯爵很重要,但我不知道该怎么做。我遵循通常的步骤直到现在 - 清理数据,制作文档术语矩阵。有没有人对计数如何成为重要细节以及可以做些什么有任何建议?