我需要实现一个多类文本分类器。我想过使用word2vec,有人可以引导我找到有关此问题的优秀论文/资源。 我会有4-5个班级,我有大量的数据。我必须手动标记其中一些。如果有人可以对训练规模进行评估,那也会很棒。我计划使用预先训练的word2vec进行单词嵌入。
答案 0 :(得分:0)
您可以使用MLP执行此任务,请检查Keras' example以对路透社文档进行分类。您可以在模型的开头添加嵌入图层,并使用预训练的模型权重加载它。
请记住,有一个多类分类,为每个输入输出一个类,并且有多标签分类,可能为每个输入输出许多类(您没有说明您的数据字符)所以只是让你知道)。