我想用German STW Thesaurus for Economics注释几个XML文件。您可以将文件here作为ZIP-Archives获取为RDF / XML,N3和Turtle(每个约14MB)。
所以我编写了一个Python脚本,删除了停用词,词形词,并进行了词性标注。现在我想检查其中一个XML文件中的名词是否在STW-Ontology中。如果是,我想为以后做自动分类做不同的选择:
skos:altLabel
Word,则将其替换为skos:prefLabel
Word skos:prefLabels
,并计算skos:prefLabel
及相关skos:altLabels
skos:broader
要查找,例如与skos:prefLabel
相关联的Economic sectors或Commodities。我知道GATE和Apolda,它们可以做到这一点,但它们是基于Java的,我希望从一个Python脚本中做所有事情。端。
有什么建议吗?
答案 0 :(得分:0)