使用spacy拼写检查同音字和数字

时间:2018-04-08 16:17:32

标签: spell-checking spacy

我正在使用管道将语音翻译成文本。演讲将是一种技术专业术语,出现首字母缩略词以及描述数量和价值的短语。 股票语音到文本翻译很可能会误解我感兴趣的术语和短语。我有一个语料库,我可以在其中标记这些单词和短语。 有没有办法使用spacy(或者可能是其他一些NLP工具)来应用拼写检查,例如' pee-age'或者' pee-oh-to'将被纠正为“pH值”。和' pO2'分别? 此外,对于指定了数字和数量的短语,例如,一个二十分之一'将更正为' 120cc'? 提前致谢

0 个答案:

没有答案