我已经使用OneClassSVM构建了文本分类器。
我的训练集仅对应一个标签,即(“是”),而我没有其他标签数据(“否”)。我的任务是建立一个分类器,如果它与训练数据非常相似,则将新的看不见的句子(测试数据)分类为1。否则,它分类为-1,即(异常)。
我已经使用Word2Vec为我的训练数据构建单词嵌入。然后,我在OneClassSVM中使用词向量平均来构建异常检测器分类器。
该分类器当前的准确度约为50%-55%。我必须进一步增强它,以构建可靠的分类器。
任何有关此问题的建议都会有所帮助...
答案 0 :(得分:1)
我建议采用一种非常不同的方法,因为您根本没有负面课程的培训示例。 您可以在训练数据上训练语言模型。在推论时,您使用语言模型对输入进行评分,然后根据LM根据输入句子的困惑性的某个阈值对其进行分类。