识别英语中的伦理词

时间:2013-09-05 15:44:46

标签: machine-learning nlp ontology

问题:我一直在寻找方法来确定英语中的某个单词是否与道德相关/是否具有道德含义。

方法:一个想法是使用仅包含道德关键字的词典,或使用现有的ontology道德。但是,我没有找到任何本体或词典。我也尝试使用通用本体而没有任何成功。例如,我尝试使用WordNet的方法没有任何运气。作为一个典型的例子,假设有问题的词是“隐私”。如果我从词根“道德”开始,看看它的上位词/下位词,我就无法达到“隐私”或“隐私”。我还考虑建立一个classifier,但没有在候选人的候选人名单上取得进展。

问题:1)是否存在道德的本体或词典?或者2)我怎么能用WordNet自己构建一个?或3)建议其他方法将单词标识为“道德”,即单词分类器?

1 个答案:

答案 0 :(得分:0)

一种可能的方法是构建您自己认为“道德”的单词集,然后训练一些基于语义的分类器来概括概念。这里可以使用带有WordNet Kernel的支持向量机 - 这个内核用于测量WordNet本体中的语义相似性 - 所以一旦提供了你认为“道德”的词,它将通过分析基于Wordnet的语义来构建“道德概念”。与你的训练集相比的新单词。因此,它不仅会“跳过”来自“伦理学”的上位词/下位词,而且会从所有<中考虑这种跳跃(以及共同出现,这在关于WordNet内核的论文中有详细描述)。 / strong>您提供的“道德”字样。在这里使用One-class SVM很重要,因为您对将“道德”词汇与其他词汇分开很感兴趣,因此很难为两个类SVM构建良好的训练集。

简而言之,您可以:

  • 建立“道德词汇”列表
  • 使用WordNet内核训练单类SVM
  • 用它来分类这个词是否符合道德标准