培训斯坦福RSS和Shift减少解析器的新语言

时间:2017-05-22 05:29:36

标签: java parsing stanford-nlp shift-reduce

我想用现有的树库培训基于Stanford Parsers(RSS和Shift Reduce)的选区,但是在网上找不到足够的信息才能这样做。两个关键问题:

  1. 我应该以什么格式导出我的树库以便能够训练每个解析器? (我注意到"Standard Treebank format"应该用于SR解析器 - 但是我找不到这种格式看起来的规范。如果它与PENN Treebank使用的格式相同,那么树应该如何拆分?单个文件按换行符分隔?在单独的文件中?)

  2. 我是通过在IDE中编写一些Java代码来以编程方式尝试此操作的。假设我现在有正确的文件,我将如何训练每个解析器?应该以什么顺序使用哪种方法调用?

  3. 我无法从源代码或Javadocs中找出这些解析器中的每一个。任何建议都将不胜感激。

0 个答案:

没有答案