如何从博客评论的原始情绪数据集中为stanford核心nlp情感分析创建转换数据集(基于树)?

时间:2015-07-30 18:59:56

标签: stanford-nlp sentiment-analysis

我有一套博客评论培训,如何为递归深层模型创建培训数据?

与样本数据一样

(4(4(2 A)(4(3(3暖)(2,))(3搞笑)))(3(2,)(3(4(4个接合)(2个胶片))( 2。))))

1 个答案:

答案 0 :(得分:0)

如您所示,RNN情绪模型需要在每个树节点处使用情感数据标记的解析语言训练集。

您需要自己制作这些注释(即手动),以保证解析器的质量。 multer中有一些关于如何通过众包创建培训数据的详细信息。有足够的动力,时间和金钱,你也可以这样做。

较小的替代方案是首先使用标准解析器和情绪模型自动标记数据,然后手动修复解析和情绪错误。如果您正在使用的文本域与用于训练模型的文本域相似,则这可能是站得住脚的。由于您正在处理博客评论,遗憾的是情况并非如此!