有哪些树库可供StanfordCoreNLP法国模特训练?

时间:2017-11-28 10:12:45

标签: stanford-nlp

根据这篇文章的标题,我希望获得有关用于训练此页面上提供的StanfordCoreNLP法语模型的数据集的最大信息(https://stanfordnlp.github.io/CoreNLP/history.html)。我的最终目标是了解stanford核心nlp工具在使用它来表征用法语编写的文本时可以输出的标记集。我被告知使用树库训练模型。对于法语,有6个(http://universaldependencies.org/,法语部分): - FTB - 原版的 - 红杉 - ParTUT - PUD - 说 所以我想知道哪些是用来训练哪种法国模特。

我首先在专门针对java nlp用户的邮件列表中提出了这个问题(java-nlp-user@lists.stanford.edu),但直到现在还没有用。

所以,再说一次,假设它是一个上面描述的树库,确实用于训练上面链接中提供的stanford核心nlp法语模型,其中一个是什么?或者,如果这里没有人知道,谁(姓名和姓氏)会知道这个问题的答案?

1 个答案:

答案 0 :(得分:0)

对于所有对此感到好奇的人,这里有一些关于斯坦福CoreNLP中使用法语的数据集的信息:

French POS tagger: CC (Crabbe and Candito) modified French Treebank
French POS tagged (UD version): UD 1.3
French Constituency Parser: CC modified French Treebank
French NN Dependency Parser: UD 1.3

另请注意,选区解析器parse无法将选区解析转换为依赖解析英语选区解析器的方式。