更正nlp中的名称

时间:2017-05-05 18:07:56

标签: nlp stanford-nlp

我有一个数据集,其中许多名称被写成man1sh而不是manish,vikas就像v1kas。

如何在nlp中更正这些名称?

感谢任何帮助。

1 个答案:

答案 0 :(得分:1)

尝试基于深度神经网络的拼写校正https://medium.com/@majortal/deep-spelling-9ffef96a24f6此方法是目前最先进的方法。这是代码https://github.com/MajorTal/DeepSpell,其中一些已经对它进行了改进https://hackernoon.com/improving-deepspell-code-bdaab1c5fb7e.I我找不到论文,但也有一篇论文发表了一个字符级深度神经网络,用于编辑距离,效果很好和公共数据集。

对于上述方法,与所有机器学习解决方案一样,您需要数据进行培训。如果您的案例没有数据,那么旧的简单编辑距离方法http://norvig.com/spell-correct.html是唯一的方法。