应用错误收集

时间：2015-07-30 18:59:56

标签： stanford-nlp sentiment-analysis

我有一套博客评论培训，如何为递归深层模型创建培训数据？

与样本数据一样

（4（4（2 A）（4（3（3暖）（2，））（3搞笑）））（3（2，）（3（4（4个接合）（2个胶片））（ 2。））））

答案 0 :(得分：0)

如您所示，RNN情绪模型需要在每个树节点处使用情感数据标记的解析语言训练集。

您需要自己制作这些注释（即手动），以保证解析器的质量。 multer中有一些关于如何通过众包创建培训数据的详细信息。有足够的动力，时间和金钱，你也可以这样做。

较小的替代方案是首先使用标准解析器和情绪模型自动标记数据，然后手动修复解析和情绪错误。如果您正在使用的文本域与用于训练模型的文本域相似，则这可能是站得住脚的。由于您正在处理博客评论，遗憾的是情况并非如此！