手写文字识别模型

时间:2020-06-26 20:38:05

标签: python tensorflow machine-learning keras

我一直在尝试创建一个给定图像的模型,该模型可以读取其中的文本。我正在尝试通过实现cnn,rnn和ctc来做到这一点。我正在使用TensorFlow和Keras进行此操作。我有些困惑。为了读取个位数,我知道您在模型的最后一层应该有9个节点,因为这些是选项。但是,对于阅读单词来说,没有无限多个选择,因此在最后一层中应该有多少个节点。另外,对于如何将ctc添加到Keras模型中,我感到困惑。是作为损失函数吗?

1 个答案:

答案 0 :(得分:0)

我在这里看到两个选项:

  1. 您可以构建模型来识别这些单词中的单独字母,然后最后一层中的节点与模型中要读取的字母中的字母和符号一样多。
  2. 您可以将模型输出为矢量,然后使用其他可以将单词编码/解码为矢量的工具“解码”此矢量。我可以想到的一种这样的工具是word2vec。或者可以选择下载一些可能的单词数据库,然后自己创建这样的工具。
    您的模型描述非常模糊。如果您想获得更多具体的帮助,则应提供更多信息,例如一些模型架构。