确定单词的性别

时间:2016-09-21 03:10:31

标签: nlp

我希望对文字进行匿名处理,其中一项任务是删除对被引用人的性别的引用。如果失去一点意义,那就没关系,但不是更可取(事实证明这是自动化的实际结果)。

像他/她/他/她这样的词语暗示了被提及者的性别。这些是我正在寻找的词。

鉴于其中一个词,我可以规范化(可能只是选择其中一个词),但我需要能够先识别它们。

我天真的想法是在字典中搜索任何带有指定性别的定义的单词。这很有效,但很吵。

是否有更好的方法来确定性别特定的单词(英文),或者(最好是自动的)方法来确定它们?

1 个答案:

答案 0 :(得分:1)

您是否了解将用于自动执行该任务的平台/语言/软件?

例如,您可以尝试使用此Gate插件:Pronoun Annotator

能够用他们的性别来标注代词。这可以帮助你完成任务。