现在我使用一些神经网络进行OCR,它会产生输出符号和一些概率。我也有算法分割触摸字符。
我希望使用概率来决定何时应用拆分。 但是现在我无法做到这一点,因为我的网络有时会提供触摸字符高于正常字符的概率。
此外,我无法理解即使在分裂之后发生了什么 - 有时正常的符号可以被分成另外两个符号,这两个符号都可以被识别出初始符号的概率更高。
所以我需要决定做什么。问题是 神经网络至少在理论上能为这种意义上的OCR提供可靠的概率吗? 如果有可能那么我应该尝试做什么?我应该尝试处理当前输出还是更多地训练网络或选择其他网络?
非常感谢任何形式的帮助或建议
答案 0 :(得分:0)
您的方法很好,最终应该提供足够的培训数据,并且您可以从预处理,拆分,培训等中删除足够的错误。
确保您在训练集中(训练前)分割的方式与测试时分割数字的方式完全相同。
但请注意,机器学习会在一定精度内生成正确的算法,因此您总能找到失败的实例。问题是您的整体测试性能有多好(例如%正确数字),以及如何将其提高到应用程序所需的级别。
问题是神经网络至少在理论上可以提供可靠性 这种意义上的OCR概率?
是
如果有可能那么我应该尝试做什么?我应该尝试 处理当前输出或训练网络更多或选择另一个 网络
以上所有内容直到它起作用!培训规模是关键因素之一,随着培训规模的扩大,您可以扩展网络以提高准确性。