从普通的非结构化文本中提取数学表达式的工具/方法

时间:2018-02-21 08:40:25

标签: python nlp artificial-intelligence ner

我需要识别嵌入在文本中的数学表达式。例如"记下A + B的值。"在这里' A + B'是我需要提取的部分,它不是使用像Latex这样的结构化文本表达的,而是使用简单的非结构化文本表达。

是否有任何工具/方法可以在文本中提取此类表达式,例如POS标记器或数学表达式的名称实体识别工具?

首先,我尝试使用正则表达式执行此操作,但这对复杂表达式来说并不成功。我发现许多研究论文从扫描文档(从图像)或结构化文本中提取数学表达式,但我没有发现纯文本。

0 个答案:

没有答案