NLP语法:修复一个?

时间:2014-04-16 06:01:25

标签: algorithm language-agnostic nlp

有没有办法检查句子中a是否真的应该是an

例如,它确实应该修复以下内容:

A apple => An apple

但以下是正确的:

A urologist

  

在英语中,正确选择a和a取决于初始值   他们这个词的一个词的声音,而不是在最初的字母上   先。在以a开头的所有单词之前应该使用字母a   除了沉默的h(一种荣誉)和在开始之前的辅音   元音代表组合辅音和元音的元音   (大学,单位)。

2 个答案:

答案 0 :(得分:3)

使用文本进行语音转录翻译并检查单词是否以元音开头。

英文拼音字母 http://www.phon.ucl.ac.uk/home/wells/phoneticsymbolsforenglish.htm

apple     ->  ˈæpl̩ 
urologist ->  jʊəˈrɒlədʒi 

编辑: 有一些特殊情况是规则的例外。

  • 历史性的 - > hɪˈstɒrɪk
  • 一个可怕的 - > həˈrɪfɪk
  • 酒店 - > ˌhəʊˈtel

此处有更多信息 http://www.oxforddictionaries.com/words/a-historic-event-or-an-historic-event

答案 1 :(得分:1)

我会采用统计方法,掌握一个巨大的集合(语料库),并为其中的每个单词找到它之前的a次数和它的次数前面是an。 (这是一次完成,预处理)。

根据以上所述,确定您的a是否真的应该是an