Question

根据这篇文章的标题，我希望获得有关用于训练此页面上提供的StanfordCoreNLP法语模型的数据集的最大信息（https://stanfordnlp.github.io/CoreNLP/history.html）。我的最终目标是了解stanford核心nlp工具在使用它来表征用法语编写的文本时可以输出的标记集。我被告知使用树库训练模型。对于法语，有6个（http://universaldependencies.org/，法语部分）： - FTB - 原版的 - 红杉 - ParTUT - PUD - 说所以我想知道哪些是用来训练哪种法国模特。

我首先在专门针对java nlp用户的邮件列表中提出了这个问题（java-nlp-user@lists.stanford.edu），但直到现在还没有用。

所以，再说一次，假设它是一个上面描述的树库，确实用于训练上面链接中提供的stanford核心nlp法语模型，其中一个是什么？或者，如果这里没有人知道，谁（姓名和姓氏）会知道这个问题的答案？

Answer 1

对于所有对此感到好奇的人，这里有一些关于斯坦福CoreNLP中使用法语的数据集的信息：

French POS tagger: CC (Crabbe and Candito) modified French Treebank
French POS tagged (UD version): UD 1.3
French Constituency Parser: CC modified French Treebank
French NN Dependency Parser: UD 1.3

另请注意，选区解析器parse无法将选区解析转换为依赖解析英语选区解析器的方式。

有哪些树库可供StanfordCoreNLP法国模特训练？

1 个答案: