我有一个1,00,000多个文档的培训数据集,分为大约100个类别。我正在尝试使用DeepLearning4java库来预测文本的类别,代码基于ParagraphVectorsClassifierExample示例。每个文档都是一条短文本。
我将可用数据分成训练(80%)和测试数据(20%)。通过对参数进行大量调整,我可以对测试数据进行最大20%的正确预测。我知道很多事情都取决于输入数据本身。但是,只想检查是否可以进一步提高准确性。我在示例代码中看到了"这个例子可以通过使用学习级联来提高准确性" 。任何提高预测准确性的提示/帮助/建议都将受到高度赞赏。