标签: deep-learning dataset spell-checking
我有属于自己的数据。我需要为此写一个拼写检查器。我正在处理MajorTal的this帖子。
我对深度学习并不陌生,所以对于如何创建自己的数据集供基于RNN的拼写检查器使用感到困惑。 例如,有一个单词“ shubhkamna”被错误地拼写为“ shunhkamna”。这将如何进入数据文件,以便拼写检查器知道更正? 如何创建可用于此拼写检查程序训练的此类单词的数据集? 请详细说明注释的格式以及需要在this代码中进行更改的代码行。预先感谢。