标签: python nlp artificial-intelligence ner
我需要识别嵌入在文本中的数学表达式。例如"记下A + B的值。"在这里' A + B'是我需要提取的部分,它不是使用像Latex这样的结构化文本表达的,而是使用简单的非结构化文本表达。
是否有任何工具/方法可以在文本中提取此类表达式,例如POS标记器或数学表达式的名称实体识别工具?
首先,我尝试使用正则表达式执行此操作,但这对复杂表达式来说并不成功。我发现许多研究论文从扫描文档(从图像)或结构化文本中提取数学表达式,但我没有发现纯文本。