我正在尝试解决一个问题,即每当有崩溃时(在Linux世界中)我都有包含已解码回溯(堆栈调用跟踪)的文件,并且我有一个唯一的ID来跟踪每次发生的崩溃。
我想构建一个类文件,它将从之前的已解码回溯中学习,并预测是否存在当前回溯的已存在ID。
这是我的第一个机器学习项目。我使用机器学习并在python中使用CountVectorizer和TF-IDF方法进行了试验。
我想知道分类需要考虑哪些功能以及文本分类的合适算法来解决这个问题。
答案 0 :(得分:1)
额外阅读(如果您愿意):https://machinelearningmastery.com/encoder-decoder-models-text-summarization-keras/