我想将GermaNet用于词典化(对应于WordNet中的getLemma()
),列表(实际为DTM
项 - 用于增强文本分类性能)。但是,我无法找到GermaNet的任何提示或R包。在某种程度上可以在R中使用它吗?
答案 0 :(得分:1)
我假设您可以访问存储wordnet数据的原始文件(Germanet似乎允许免费许可)。你可以解析它们(简单地使用一些漂亮的正则表达式)并提取你需要的信息(我不确切知道DTM是什么,但我想它与之间的同义词或链接有关) 。我工作的一个wordnet(不是德语)是用多个文件组织的,一些包含链接,一些信息的形式如
0 @1@ WORD_MEANING
1 PART_OF_SPEECH "v"
1 VARIANTS
2 LITERAL "someverb"
3 SENSE 7
3 DEFINITION "adefinition"
3 EXAMPLES
4 EXAMPLE "anexample"
3 EXTERNAL_INFO
...
这不应该太难解析。