根据这篇文章的标题,我希望获得有关用于训练此页面上提供的StanfordCoreNLP法语模型的数据集的最大信息(https://stanfordnlp.github.io/CoreNLP/history.html)。我的最终目标是了解stanford核心nlp工具在使用它来表征用法语编写的文本时可以输出的标记集。我被告知使用树库训练模型。对于法语,有6个(http://universaldependencies.org/,法语部分): - FTB - 原版的 - 红杉 - ParTUT - PUD - 说 所以我想知道哪些是用来训练哪种法国模特。
我首先在专门针对java nlp用户的邮件列表中提出了这个问题(java-nlp-user@lists.stanford.edu),但直到现在还没有用。
所以,再说一次,假设它是一个上面描述的树库,确实用于训练上面链接中提供的stanford核心nlp法语模型,其中一个是什么?或者,如果这里没有人知道,谁(姓名和姓氏)会知道这个问题的答案?
答案 0 :(得分:0)
对于所有对此感到好奇的人,这里有一些关于斯坦福CoreNLP中使用法语的数据集的信息:
French POS tagger: CC (Crabbe and Candito) modified French Treebank
French POS tagged (UD version): UD 1.3
French Constituency Parser: CC modified French Treebank
French NN Dependency Parser: UD 1.3
另请注意,选区解析器parse
无法将选区解析转换为依赖解析英语选区解析器的方式。