iOS平台上的方程式和公式的OCR(Xcode)

时间:2013-01-19 23:17:22

标签: iphone xcode math tesseract equation

我目前正在开发一个应用程序,该应用程序使用支持iOS的设备相机识别照片中的方程式,然后将它们与库或数据库中的正确方程式相匹配 - 基本上是方程式扫描仪。例如,您可以扫描不确定性原理或薛定谔方程的图像,iOS设备将能够通知用户它的名称和某些反馈。

我想知道如何使用Xcode实现这一点,我正在考虑使用开源框架,如Tesseract OCR或OpenCV,但我不确定如何将这些应用于方程式。

非常感谢任何帮助。 感谢。

1 个答案:

答案 0 :(得分:1)

这就是为什么这是超级雄心勃勃的原因。 OCR正在做的事情基本上是采用一组有限的点,并试图将它与一个非常小的集合中的一个成员匹配。你在谈论的事情更多的是成语而不是角色等级。例如,如果我将贝叶斯规则表示为一个等式,我就会有:

P(A|B) = P(B|A)P(A)/P(B)

即使它成功识别出这些字符中的每一个,你也必须使用它来修正等式中的等式中的特征。更不用说,这只是贝叶斯规则的一种表现形式。还有一些使用Sigma Notation(LaPlace的变体),有些使用日志,所以他们没有特殊情况0。

这可以用贝叶斯完成。以下是对此的一些想法:

  1. 首先,您必须将等式视为分类,并且您必须根据一组要素来描述它们,例如,Sigma Notation的存在或日志的应用。
  2. 系统将通过显示您想要识别的所有方程式进行训练,可能是每种方程式的变化(每个上面)。然后这些分类将具有特征分布。
  3. 最后,当显示一个新的等式时,系统必须找到这些特征中的每一个,然后循环分类并计算等式与给定分类匹配的总概率。
  4. 这就是90%的垃圾邮件引擎的完成方式,但在那里,它们只有两种分类:垃圾邮件而非垃圾邮件,而且功能表示非常简单:只是不同文档类型中单词出现的比例。

    有趣的问题,肯定没有简单的答案。