根据上下文更正或补充单词

时间:2019-07-18 19:53:30

标签: nlp prediction word2vec

我正在研究文本规范化。我有变量/属性的描述,需要将其转换为正确的英语。 一个示例如下所示: “这是客户订单的sta” 需要根据错误和上下文将上方的“ sta”一词转换为“ status”。

我尝试了字符级编码器解码器体系结构,但没有得到很好的结果。我需要一些有关如何解决此问题的指导。

输入:“这是客户订单的状态”

输出:“这是客户订单的状态”

1 个答案:

答案 0 :(得分:0)

这称为拼写检查。有许多方法可以这样做,一种常见的方法是使用最小编辑距离。编辑是以下操作之一:添加一个字符,删除一个字符,用另一个字符替换一个字符,转置两个相邻的字符。您可以使用编辑功能从错误的单词中重新生成单词,并使用词典查看单词是否真的存在于英语中。每个不正确的单词可能有1个以上的候选单词可供选择。候选人排名也有多种方法。 阅读本文可能是一个不错的开始:

A Survey of Spelling Error Detection and Correction Techniques