我试图找出使用Syntaxnet可以获得长文档文本分析的哪些改进,而不是像文字计数,句子长度等那样的“哑”。
目标是获得更准确的语言措施(例如“语调”或“复杂程度”),以量化长文件(如报纸文章或信件/备忘录)的属性。
我想弄清楚的是,一旦POS标记结束,如何处理Syntaxnet输出。人们用什么类型的东西来处理Syntaxnet输出?
理想情况下,我正在寻找一个示例工作流程,将Syntaxnet输出转换为可用于统计分析的定量输出。
此外,有人可以向我指出一些资料,这些资料显示了使用Syntaxnet进行的“智能”分析得出的推论与通过字数,句子长度等可以获得的推论相比较吗?