数学公式的OCR库

时间:2010-08-25 21:08:27

标签: ocr

我需要一个开放的OCR库,它能够扫描复杂的打印数学公式(例如通过LaTeX生成的一些公式)。我想得到一些类似LaTeX的输出(或者只是一些类似AST的数据)。

有没有这样的东西?或者当前的OCR技术是否只能解析面向行的文本?

(请注意,我还发布了this question on Metaoptimize,因为那里的某些人可能还有其他知识。)

OpenAI还将此问题描述为im2latex

9 个答案:

答案 0 :(得分:6)

InftyReader是我唯一知道的。它不是免费软件(似乎这笔资金流向非营利组织,IIRC)。

http://www.sciaccess.net/en/InftyReader/

我不知道为什么PDF不能在LaTeX中拥有元数据?如:将LaTeX方程式放入其中!这太难了吗? (我不知道有关PDF语法的任何内容,但我认为可以做到这一点。)

LaTeX语法是数学符号的唯一标准。制作MathML和其他东西的人们并没有考虑到这一点,这似乎是非常愚蠢的。 InftyReader生成MathML或LaTeX语法。

如果我想要HTML(纯),那么我使用TTH来读取LaTeX语法。只是工作。

ABBYY FineReader(一个伟大的OCR程序)声称你可以训练数学软件,但这是一个极大的脑死亡(谁有时间?)

Unicode有很多数学符号。今天的OCR读者无法理解它们显示了这项活动中令人遗憾的软件状态和大脑缺陷。

对于“一次一个符号”,TeX显然有关于它将放置符号的位置的规则。他们不能编写知道这些规则的软件?! TeX甚至是公共领域!他们可以在他们的商业产品中“使用它”。

答案 1 :(得分:5)

根据answers on Metaoptimizediscussion on the Tesseract mailinglist,似乎没有开放/免费解决方案可以做到这一点。

似乎能够做到这一点的唯一解决方案(但我无法验证,因为它只是Windows和非免费),就像其他一些人提到的那样InftyProject

答案 2 :(得分:5)

结帐“Web Equation。”它可以将手写方程转换为LaTeX,MathML或SymbolTree。我不确定引擎是否是开源的。

答案 3 :(得分:2)

考虑到当前技术一次读取一个符号(参见http://detexify.kirelabs.org/classify.html),我怀疑是否存在完整数学方程式的OCR。

答案 4 :(得分:2)

Infty运作良好。我以前的公司将它集成到一个应用程序中,该应用程序可以为盲人大声读出方程式,并且正在从用户那里得到很好的反馈。

http://www.inftyproject.org/en/download.html

答案 5 :(得分:1)

由于复杂公式的数学OCR输出可能会有错误 - 即使人类也遇到问题 - 你必须校对结果,至少在它们是否重要的​​情况下。然后(人类)校对者必须更正结果,这意味着你需要有一个数学公式编辑器。考虑到人类所需的努力,可能是有限的复杂公式语料库,您可能会发现将任务分配给人类更容易。

作为一个研究问题,通过OCR阅读数学很有趣 - 你需要一个二维语法的形式主义和一个符号识别器。
除了这里已经提到的参考文献,为什么不谷歌这个?有工作在加州理工学院,罗切斯特,英国滑铁卢和加州大学伯克利分校完成。有多少可以立即使用?说不上。

答案 6 :(得分:1)

截至2019年8月,根据您的需要有一些选择: 要将印刷的数学方程式/公式转换为LaTex,Mathpix绝对是最佳选择。免费。 对于将手写数学转换为LaTex或打印数学,MyScript是最佳选择,尽管其应用程序需要花费几美元。

答案 7 :(得分:0)

你知道,Win7中只有一个应用程序:Math Input Panel。它甚至可以处理手写输入(它实际上是为此而制作的)。如果你有Win7就试一试,它是免费的!

答案 8 :(得分:0)

有一段很棒的短视频:http://www.youtube.com/watch?v=LAJm3J36tLQ 解释如何训练您的Fine Reader识别数学公式。如果您已经使用Fine Reader,最好坚持使用一个工具。当然它不是免费的商品:(