如何使用GermaNet(WordNet德国通讯员)与R

时间:2014-03-19 04:40:28

标签: r wordnet lemmatization

我想将GermaNet用于词典化(对应于WordNet中的getLemma()),列表(实际为DTM项 - 用于增强文本分类性能)。但是,我无法找到GermaNet的任何提示或R包。在某种程度上可以在R中使用它吗?

1 个答案:

答案 0 :(得分:1)

我假设您可以访问存储wordnet数据的原始文件(Germanet似乎允许免费许可)。你可以解析它们(简单地使用一些漂亮的正则表达式)并提取你需要的信息(我不确切知道DTM是什么,但我想它与之间的同义词或链接有关) 。我工作的一个wordnet(不是德语)是用多个文件组织的,一些包含链接,一些信息的形式如

0 @1@ WORD_MEANING
  1 PART_OF_SPEECH "v"
  1 VARIANTS
    2 LITERAL "someverb"
      3 SENSE 7
      3 DEFINITION "adefinition"
      3 EXAMPLES
        4 EXAMPLE "anexample"
      3 EXTERNAL_INFO
...

这不应该太难解析。